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Apresentação 


Este texto foi elaborado como um primeiro curso de Álgebra Linear, desenvolvendo conceitos básicos na 
primeira parte e avançando para outros tópicos e aplicações na segunda parte. 

O texto começa com espaços vetoriais e aborda matrizes somente após transformações lineares. Isso é 
feito por diferentes motivos: primeiro, para que o leitor tenha tempo para digerir os conceitos abstratos 
apresentados inicialmente. Se a abstração é construída aos poucos, corre-se o risco de não haver tempo 
para que essas abstrações sejam devidamente digeridas; além disso, para não passar inicialmente a impres- 
são de que a Álgebra Linear trata simplesmente de álgebra de matrizes reais, para que de imediato fique 
claro que espaços vetoriais não são necessariamente compostos apenas de tuplas (há espaços de dimensão 
infinita que são facilmente descritos), e também para ilustrar de imediato a natureza abstrata da Álgebra, 
e da sua relevância em problemas práticos: ao final do primeiro capítulo há vários exemplos de uso de es- 
paços vetoriais em Criptografia, códigos corretores de erros e na solução do cubo mágico. Há também uma 
boa quantidade de aplicações ao final de todos os outros Capítulos. 

Os exemplos e aplicações são incluídos no final dos capítulos, e não no início. Isso contraria a idéia de 
que os conceitos apresentados devem ser motivados. Penso que a motivação deveria ser substituída, pelo 
menos no início da leitura, por confiança: o leitor deve confiar em que existe uma razão para estudar toda 
a abstração e o ferramental apresentado, por mais estranhos que lhe pareçam. Terminando cada capítulo, 
haverá a oportunidade de confirmar a utilidade dos tópicos estudados. 

Os pré-requisitos imprescindíveis para a leitura deste livro são Cálculo em uma variável reale Geometria 
Analítica. Alguns dos exemplos farão uso de Cálculo em várias variáveis, números complexos, probabilidade 
básica, grafos e equações diferenciais - mas estes exemplos podem ser deixados de lado sem comprometer a 
sequência do texto. Para que o livro seja tão autocontido quanto possível, há um apêndice com uma revisão 
de sistemas lineares e matrizes, um introduzindo o método da indução finita, e um com noções básicas de 
Equações Diferenciais. 

Seções, exemplos e exercícios marcados com estrela (kr) são opcionais, ou porque são difíceis ou porque 
usam conceitos normalmente não abordados em um primeiro curso de Álgebra Linear, como corpos finitos. 
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Nomenclatura 


Vetores (elementos de um espaço vetorial, não apenas vetores em R”) são grafados em negrito: v,w,.... 
Representamos vetores em R” como vetores-coluna em todo o texto: 


vı 
V2 
V= 
Vn 
Em texto corrido e em muitas fórmulas, denotamos tais vetores como transpostas de linhas: v = (v1,V2,...,Vn)!. 


Em diversas ocasiões, somatórios são denotados apenas por 


ao invés de 


i=l 


sendo sempre possível determinar, a partir do contexto, quais os valores do índice i. 


Frações são fatoradas para fora de matrizes sempre que é possível fazê-lo, para tornar matrizes mais 
facilmente legíveis e simplificar operações de multiplicação: 


O E —& 01 
Z y2. 5 

Te air 
TIT e 2 11 13 


Não usamos setas para representar os eixos em R? e R3, porque as reservamos para vetores. Por exemplo, 
LA a ~ 4 A Z . e 
o gráfico da função E — x? — x? + 5x — 1 é mostrado na próxima figura. 
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Capítulo 1 


Espaços Vetoriais 


A Álgebra Linear pode ser vista como uma generalização natural da Geometria Analítica. Da mesma forma 
que, na Geometria, somamos pares de vetores e multiplicamos vetores por escalares, podemos fazê-lo com 
outros objetos - matrizes (A + B, kA), funções ((f + 9)(x), kf(x)), sequências ((an) + (bn), k(an)). 

A Álgebra tem como objeto de estudo o comportamento de operações definidas sobre conjuntos. A 
Álgebra Linear trata epecificamente de espaços vetoriais: conjuntos onde são definidas as operações de soma 
e multiplicação, de forma que fique bem definida também a expressão ax + b. 

Os espaços vetoriais são um dos mais importantes exemplos de estrutura algébrica. A idéia abstrata 
de espaço vetorial generaliza o conceito de vetores no espaço tridimensional de duas maneiras. Primeiro, 
espaços vetoriais podem ter dimensão maior que tres. E segundo, definimos espaços vetoriais não apenas 
com vetores “geométricos”, mas com diferentes objetos matemáticos (por exemplo números, matrizes, 
polinômios, funções) - e podemos tratar desses objetos de forma unificada. 

A fim de melhor contextualizar a definição de espaço vetorial, este Capítulo traz uma breve descrição 
do que é uma estrutura algébrica, descrevendo também grupos e corpos. 


1.1 Estruturas algébricas 


Além de números, podemos somar e multiplicar outros objetos - o exemplo mais simples talvez seja o 
de matrizes. Quando definimos soma e multiplicação para objetos diferentes, estas operações podem ou 
não ter propriedades semelhantes. Tanto para números reais como para matrizes, a soma é associativa: 
a+(b+c)=(a+b)+c. No entanto, a multiplicação de números reais é comutativa (ab = ba), mas a 
comutatividade não vale, de forma geral, para a multiplicação de matrizes. 

Ao estudar diferetes tipos de objetos e operações definidas sobre eles, identificamos algumas classes de 
objetos para os quais as operações se comportam de maneira semelhante. Damos a essas classes de objetos 
com operações algébricas o nome de estrutura algébrica. 

Estrutura algébrica (ou sistema algébrico) é o nome dado a um conjunto com algumas operações definidas 
sobre ele. Por exemplo, o conjunto dos números reais com as operações de soma e multiplicação, (R, +, -) 
é uma estrutura algébrica. O conjunto das matrizes com a operação de soma de matrizes e a operação de 
multiplicação por escalar (M, +, -) é outra estrutura algébrica. Um terceiro exemplo de estrutura algébrica 
é o conjunto dos inteiros com a operação de soma, (Z, +). Cada um destas estruturas tem características 
diferentes, e pode ser classificada de maneiras diferentes, como veremos a seguir. 
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Antes de definirmos algumas estruturas algébricas, definimos o tipo de operação que acompanharão 
estas estruturas. Neste texto, trataremos de operações com dois argumentos, chamadas de operações biná- 
rias. 


Definição 1.1 (Operação binária). Uma operação em um conjunto A é uma função que leva um ou mais 
elementos de A em outro elemento de A - ou seja, é uma função f: A x A x- x ASA, 
Dizemos que uma operação é binária se aceita dois argumentos - ou seja, é da forma f : A x A > A. 
Dizemos que uma operação binária é associativa, se ax (bxc) = (axb)xc e comutativa, se axb = bxa. 
Um elemento e € A é neutro para a operação x se para todo a € A,axe=exa=a. + 


Exemplo 1.2. Em R, as operações de soma e multiplicação são associativas e comutativas, porque 


x+y =y+x (comutatividade) 

x+ (y +z) =(x+y)+z (associatividade) 
xy = yx (comutatividade) 

x(yz) = (xy)z (associatividade) 


No entanto, as operações de divisão e subtração não são comutativas. A subtração é associativa, e a divisão 
não é: 


X—-ULZy—x (não vale a comutatividade) 
x—(y-z)=(x—-y)—z (associatividade) 
x/y £y/x (não vale a comutatividade) 
x/(y/2) £ (x/y)/z (não vale associatividade) 


O neutro para soma é o zero, e o neutro para multiplicação é o um porque 
0O+x=x 


(1)x =x 


Não definimos neste texto neutro para subtração e divisão, porque as operações não são comutativas, e o 
neutro e teria que satisfazer x — e = e — x = x, e x/e = e/x = x, que não sería possível. < 


Exemplo 1.3. No conjunto de matrizes quadradas de ordem n, a operação de soma é comutativa e associ- 
ativa, porque para duas matrizes A e B, temos 


A+B=B+A (comutatividade) 
A+(B+C)=(A+B)+C (associatividade) 


No entanto, a operação de multiplicação é associativa, mas não comutativa: 


AB # BA (não vale a comutatividade) 
A(BC) = (ABJC (associatividade) 


O neutro para a soma de matrizes é a matriz zero (ou seja, a matriz cujos elementos são todos zero). 
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O neutro para multiplicação de matrizes é a identidade, porque, apesar da multiplicação de matrizes não 
ser comutativa, temos 
TA=ÁIEA, 


para toda matriz quadrada A. < 
Exemplo 1.4. O produto vetorial em R? é definido como 
v X W = (x2y3-—x3y2)er 


+ (x3y1 — X1Y3)e2 
+ (x142 — x2y1)es, 
onde e1, e; e e; são os vetores unitários nas direções dos eixos x, y e z (também os chamamos de versores). 


O resultado do produto vetorial v x w é um vetor s, perpendicular tanto a v como a w. Por exemplo, se 
v = (3,0,0)! ew = (0,2,0)!,o produto vetorial s = v x w é (0, 0, 6)", ortogonal a ambos. 


VXW 
4 


E R 


A magnitude de s é zero quando v e w são paralelos e é igual ao produto das magnitudes de v e w quando 
estes são perpendiculares. 
Esta operação não é comutativa, porque 


vxw=—(Wxv). 
A operação também não é associativa, porque 
ux (vxw) 
é um vetor no mesmo plano que v e w, enquanto 
(u x v) x w 
é um vetor no mesmo plano que u e v. « 


Definição 1.5 (Fechamento). Seja A um conjunto com uma operação x, e seja B C A, Dizemos que B é 
dito fechado sob a operação x se e somente se a operação com dois elementos de B sempre resulta em outro 
elemento de B - ou seja, Vx, y E B,x xy E B. + 
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Exemplo 1.6. As quatro operações aritméticas definidas nos reais são operações binárias. Além disso, nos 
reais a soma e a multiplicação são comutativas (a + b = b + a) e associativas (a + (b +c) = (a+b) +œ). 
Os reais são fechados para as quatro operações. 
Poderíamos tentar definir as quatro operações aritméticas para os inteiros, mas não vale o fechamento: 
a operação de divisão não tem como ser definida. A intuição nos diz que podemos dividir 9/3 e obter 3, mas 
não o podemos fazer para quaisquer dois inteiros - por isso não definimos esta operação para o conjunto 
dos inteiros, porque os inteiros não são fechados para a divisão. < 


1.2 Grupos 


Como primeiro exemplo de estrutura algébrica, tomamos os grupos. 


Definição 1.7 (Grupo). Um grupo é um conjunto não-vazio G associado a uma operação binária- : Gx G — 
G tendo as propriedades listadas a seguir. 


* Associatividade: (a-b).c=a-(b-c). 


e Existencia de neutro: Deve existir um elemento neutro e € G para a operação de grupo: Je € G : 
ae-e-a=a, 


* Existencia de inverso: Para todo a € G, há um inverso a’ € Gtalquea-a'=a'.a=e. 
Se a operação do grupo for comutativa, dizemos que o grupo é comutativo (ou abeliand). + 


Exemplo 1.8. Os inteiros com a operação usual de soma formam um grupo: (i) a soma de dois inteiros é 
um inteiro; (ii) a soma é associativa; (iii) o inteiro zero é neutro para soma; e (iv), para todo inteiro a, existe 
um inteiro —a tal que a+ (—a) = 0. O grupo também é comutativo. < 


Os conjuntos Q, R e C também formam grupo com a operação usual de adição. 
Demonstramos um teorema básico sobre grupos. 


Teorema 1.9. Seja G um grupoe x € G. Então o inverso x’ de x é único em G. 


Demonstração. Seja x € G e a, b inversos de x. Então 


a=ae 
= a(xb) xb=e, b é inverso de x 
= (ax)b associatividade 
= eb ax=e, aé inverso de x 
=b. E 


Exemplo 1.10. O conjunto { +1, —1 } com a operação usual de multiplicação é um grupo: (i) 1-1,1- —1, 
—1 - 1, —1 - —1 pertencem ao grupo; (ii) a operação é associativa; (iii) 1 é neutro; (iv) tanto 1 como —1 são 
seus próprios inversos. < 


1“Abeliano” refere-se ao matemático Norueguês Niels Henrick Abel, que deerminou que a comutatividade de certos grupos estava 
relacionada com a possibilidade de cálculo das raízes de polinômios. 
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Exemplo 1.11. O conjunto de triplag](x, y, z)! € Rê, que representam vetores no espaço tridimensional, 
com a operação de soma de vetores: 


(gyz)+(a,bc)=(x+Hay+b,z+c) 


é um grupo: (i) a soma de dois vetores é um vetor também com três números reais; (ii) a soma é associativa; 
(iii) o vetor zero é neutro; (iv) para todo vetor v = (x,y,z), existe um vetor —v = (—x, —y, —z) tal que 
v + (—v) = (0,0,0). Além disso, o grupo é comutativo. « 


Exemplo 1.12. O conjunto R* com a operação de exponenciação não é um grupo, porque não vale a asso- 
ciatividade ((a?)º + a°), E 


Exemplo 1.13. O conjunto de todas as funções de R em R, com a operação de soma de funções, é um grupo. 


* A soma de funções é associativa: f(x) + (g(x) + h(x)) = (f(x) + g(x)) + h(x), para todas funções 
f, g, hetodox € R. 


* A função zero, z(x) = 0, é o elemento neutro para a operação de soma: f(x)+z(x) = f(x)+0 = f(x), 
para todos fe x. 


* Há um inverso para toda função: f(x) tem como inversa a função g(x) = —f(x), porque f(x) + 
[f(x)] = z(x). « 


Exemplo 1.14. Dadas duas funções f e g, a composição de f com g, que denotamos f o g, é tal que fo g(x) = 
f(g(x)). 

Por exemplo, se f(x) = 1/x e g(x) = log(x), então (f o g)(x) é 1/log(x). 

O conjunto de todas as funções bijetoras de reais em reais com a operação de composição é um grupo: 


* a composição de funções é associativa: fo (go h) = (fo g)oh. 


* A função identidade f(x) = x é o elemento neutro para a operação de composição porque para toda 
função g, f(g(x)) = g(x). 


* Como nos restringimos ao conjunto das funções bijetoras, todas tem inversa: fo f7! é a identidade. 
«4 


Exemplo 1.15. O conjunto das matrizes quadradas de ordem n, com a operação de soma de matrizes, é um 
grupo, porque: 


* A soma de duas matrizes n x n resulta em outra matriz n x n. 
* A soma de matrizes é associativa. 


e A matriz Z com todas as entradas iguais a zero funciona como elemento neutro, porque A + Z = À 
para toda matriz A. 


* Toda matriz A tem inverso para a operação de soma: A + [(—1)A] = Z, onde “(—1)A” é a matriz À 
com seus elementos multiplicados por —1, e Z é a matriz zero. 


2Neste texto, adotamos a representação de vetores como coluna por padrão. 
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Já o mesmo conjunto, das matrizes quadradas de ordem n, com a operação de multiplicação de matrizes, 
não é um grupo, porque nem toda matriz tem inversa. 

No entanto, o conjunto das matrizes não-singulares de ordem n, com a operação de multiplicação de 
matrizes, é um grupo. < 


Exemplo 1.16. O conjunto R \ (—1 } com a operação x, definida como 
axb=ab+a+b 


é um grupo: (i) se a,b Z —1, então ab + a + b Æ —l e portanto pertence ao grupo; (ii) a operação é 
associativa; (iii) zero é identidade para x; (iv) o inverso de a é —a/(a + 1). 
Desenvolvemos detalhadamente as propriedades (ii) e (iii). 


(ii) 
(axb)xc=(abta+b)xc 
= (ab +a +b)c + (ab+a+b)+c 
= abc +ac +bc+ab+a+b+c 
= abc +ac+ab+a+bc+b+c 
=a(be+b+c)+ta+be+b+c 
= qx(bxc) 
(iii) 
ax TE ce, +a 
a+1 +1 +1 
= -q? a(a+1)—a 
“a+1 a+1 
N a+al+a-a 
= a-+1 
= 0. 
O grupo também é comutativo. < 


Exemplo 1.17. Dado um natural n > 0, conjunto de todas as matrizes invertíveis n x n é um grupo 
com a operação usual de multiplicação de matrizes: (i) se A, B são n x n, então AB será também uma 
matriz n x n; (ii) a multiplicação de matrizes é operação associativa; (iii) o elemento identidade é a matriz 
identidade (iv) todas as matrizes do grupo são invertíveis. 

Este grupo, no entanto, não é comutativo, já que a multiplicação de matrizes não é, de maneira geral, 
comutativa. < 


1.3 Corpo 


Definição 1.18. Um corpo consiste de um conjunto e duas operações, denotadas - e +, com as propriedades 
listadas a seguir. 


* As duas operações são associativas. 
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* As duas operações são comutativas. 

* Vale a distributividade de - sobre +. 

* Há elementos neutros O para soma e 1 para multiplicação. 

* Todo elemento do corpo tem um inverso aditivo. 

* Todo elemento diferente de O tem inverso multiplicativo. + 


Exemplo 1.19. (Q, +, -), (R, +, -) e (C, +,-) são corpos. 
Para todos estes conjuntos, 


* +e- são associativas e comutativas para números reais. 
e Vale a distributividade: a(b + c) = ab + ac para quaisquer a, be c reais. 


e O zero é neutro para soma de reais: a+0 = a para todo a; O um é neutro para multiplicação: 1a = a 
para todo a. 


* Para todo real a existe um inverso aditivo, (—1)a, tal que (—1)a + a = 0. 
* Todo a Æ 0 tem inverso multiplicativo, que denotamos a` !, tal que aa! = 1. 


O mesmo argumento pode ser repetido para Q e C. 

Há diferenças importantes entre estes três corpos: o corpo dos racionais não é completo (não contém 
os irracionais, que não podem ser representados como fração): o corpo dos reais é completo e ordenado, 
mas não inclui soluções para a inequação x? < 0; os complexos já incluem estas soluções, porque contém 
a unidade imaginária i = /—1, mas não se pode ordená-los. « 


Exemplo 1.20. Fixado um número n, denotamos o conjunto de todas as matrizes de ordem n por Mnxn. 
Este conjunto não é um corpo com as operações de soma e multiplicação de matrizes, porque: 


* Nem toda matriz diferente de zero tem inversa; 
* A operação de multiplicação não é comutativa| < 


Exemplo 1.21. Seja Q[V2] o conjunto dos números da forma a + bv2, onde a,b € Q, com adição e 
multiplicação usuais. Este conjunto é um corpo: 


* As operações são as usuais, portanto são associativas e comutativas, e vale a distributividade. 
° Há neutros: 0 + 02 para adição e 1 + 02 para multiplicação. 
* Para todo a + bv2 existe inverso aditivo —a — bv'2. 


* Para todo (a + bv'2) O existe inverso multiplicativo 


1 ( 1 ) a—bv2 
a+ bv2 a+ bv2 a— bv2 
*Um anel é o mesmo que um corpo, exceto que não vale a comutatividade para multiplicação, e os elementos não necessariamente 
tem inverso multiplicativo (ou seja, não se define a operação de divisão). Mn xn é um anel. 
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E a—bv2 


— q2-2b? 


b 
e v2 


— a2- 2b? ap? 


e o inverso multiplicativo de a + b v2 também é da forma x + y V2. Observamos que a? — 2b? £ 0 
quando a, b Æ 0. 


* Finalmente, a soma e multiplicação de elementos em Q[v'2] resulta em elementos em Q[V2]. So- 


mando, S 
a+bv2+x+yv2=(a+x)+(b+y)v2. 


Multiplicando: 


(a + bv2)(x + uv2) =ax + ayv2 + bxv2 + bv2yv2 
= qx + ayv2 +bxv2+ 2by 
= (ax + 2by) + (ay + bx)v2. < 


O próximo exemplo é o corpo Z2, de extrema importância em Computação. Este corpo é diferente dos 
outros corpos que apresentamos por ser finito. 


Exemplo 1.22. Neste exemplo exploramos um corpo com apenas dois elementos. Podemos representar 
os valores lógicos “verdadeiro” e “falso” como 0 e 1, e estes serão os elementos de nosso corpo. 
As operações que definiremos são as duas operações lógicas a seguir: 


* “e”, também denotado por ^. Por definição, o “e” de a e b é um se e somente se tanto a como b 
valem um. A tabela-verdade da operação é 


“Woo qn 
“ooo > 


e “ou-exclusivo”, também denotado por &. Por definição, o ou-exclusivo de a com b é um se e so- 
mente se a e b tem valores diferentes (um deles é zero e outro é um). A tabela-verdade da operação 


l4 


e 


= = O oja 
O = = ojl 


O conjunto (0, 1 ; com as operações lógicas A (“e”) e & (“ou exclusivo”) é um corpo: (i) as duas operações 
são associativas; (ii) as operações são também comutativas; (iii) A é distributiva sobre @ - a A (b&c) = 
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(a^b) S (a Ac); (iv) há elementos neutros: O para & e 1 para A; (v) todo elemento do corpo é seu próprio 
inverso aditivo; (vi) O único elemento diferente de O (o 1) tem inverso multiplicativo (ele mesmo). 

Este corpo é chamado de Z2, porque é subconjunto dos inteiros com dois elementos] Observe que as 
operações $ e A também podem ser descritas usando soma e multiplicação: se a e b pertencem a (0, 1), 
então 


* a ® b éo mesmo que o resto da divisão de a + b por 2, e 
* a ^b éo mesmo que ab. < 


As operações em Z2 (e, ou-exclusivo) são normalmente implementadas por circuitos lógicos usados na 
construção de computadores e outros dispositivos digitais. 


Exemplo 1.23. Este exemplo está em nível de abstração acima do resto do texto, e deve ser considerado 
opcional. 
Um número é chamado de algébrico se é raiz de algum polinômio 


= 
anx”" + an1 X" +...+ax+ ao, 


onde os a; são inteiros. Um número que não é algébrico é chamado de transcendental. 

O conjunto de todos os números algébricos é um corpo, chamado de corpo de números algébricos, muitas 
vezes denotado por A. Este corpo contém Q, i = v—1, todos os múltiplos de i com coeficientes raci- 
onais, a razão áuerd'] p, mas não contém números transcendentais como n e e. Alguns outros números 
transcendentais (e que portanto não pertencem a A) são 


. 2V2, o número de Hilbert. 
* sen 1, e de maneira geral sen x, cos x e tan x para todo número algébrico x diferente de zero. 


e it = e™™/2 = 00789576... 


0.12345678910111213141516...., o número de Champernowne, que é construído concatenando os 
dígitos dos números naturais 1,2,3,... 


Há aplicações importantes deste corpo - por exemplo, os números algébricos são usados em um método 
para obter a fatoração de números inteiros grandes, algo de grande relevância em Criptanálise. 
Não mostraremos neste texto que À é um corpo. < 


F; 


“Este corpo também é chamado de GF», onde GF significa “Galois Field”, corpo de Galois - um corpo “de Galois” é um corpo finito. 
O nome é referencia ao matemático Francês Évariste Galois, que foi quem introduciu a idéia de corpos com quantidade finita de 
elementos. 


5 é a razão a/b para todos reais tais que “+? 


o . A razão áurea está presente na Natureza de diversas formas, e é importante 


em muitas áreas das Ciências e Artes. Seu valor é 1+5, também igual à fração 
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1.3.1 Operando com corpos 


Tudo o que pudermos fazer usando as operações de corpo em números reais, também podemos fazer 
com outros corpos. Em particular, é interessante observar que podemos resolver equações e sistemas de 
equações em qualquer corpo. 

Exemplo 1.24. Facilmente resolvemos a equação linear 2x + 3 = 10 em R, isolando x e obtendo 


10-3 7 

x>—— RH. 

2 2 
Agora resolvemos equações lineares em corpos diferentes. Por lineares entendemos equações onde uma 
incógnita pode aparecer multiplicada por uma constante (ou seja, um elemento do corpo), mas não por 


outra incógnita ou por ela mesma. 
Primeiro, resolvemos 3x + 10 + v2 = 1 + 16/2 em Q[V2]: isolamos x e obtemos 


3x =1— 10+ 16v2— 2 
3x =—9 + 152 
x =-345v2. 


Este exemplo parece bastante natural, porque realizamos as operações usuais de soma e multiplicação, e 
suas inversas (subtração e divisão). Resolvemos agora uma equação em Z2. Como os elementos do corpo 
são apenas 0 e 1, somente eles podem ser usados na equação (ou seja, as constantes e incógnitas valem O 
ou 1). Em Z2, as operações que usamos são soma (ou exclusivo) e multiplicação (“e” lógico). Observamos 
que neste corpo a função inversa da soma é ela mesma, porque 


1 0. 


Embora isto possa, em um primeiro contato, parecer incorreto, nada na definição de corpo impede que 
somar dois números seja o mesmo que somar um número com seu inverso aditivo. 
Resolveremos agora a equação 1 A x & 1 = 1. Isolamos x: 


1Ax6e1 =0 
xl =0 (porque 1Ax =x) 
xil =091 
x90 =1 
x =1. < 


Exemplo 1.25. Também podemos resolver sistemas de equações lineares. Neste exemplo denotamos ^ 
por - para que a notação fique mais limpa; por exemplo, ao invés de 1^ a 60 A b, escrevemos la + Ob. 
Em Z2, resolvemos um sistema 2 x 2. 
Ixely=1 
xe ly=1 


Como Ox = 0,e ly = 1, da segunda equação temos O & y = 1, e segue imediatamente que y = 1. 
Substituindo na primeira equação, obtemos 


Ixg1.1=1 
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x21.1=1 (Ix =x) 
x®l =1 (@-1=1) 
x =0 


Verificamos agora a solução que encontramos (x = 0,y = 1): 


+1(0)81(1)=1 
+0(0)81(1)=1 


+001=1 
+081=1 
que está de acordo com o que esperávamos. 
A solução de sistemas de equações em Z2 é de grande importância em Criptografia e Criptanálise. « 


que se traduz em 


1.4 Espaços vetoriais 


Um espaço vetorial é uma estrutura que generaliza as propriedades de vetores em R?, como as conhecemos 
da Geometria Analítica. Em um espaço vetorial podemos somar elementos e realizar multiplicação - não 
por elementos do próprio espaço, mas por escalares, que são elementos de um outro conjunto (um corpo). 


Definição 1.26 (Espaço Vetorial). Um espaço vetorial sobre um corpo K é um conjunto V com duas opera- 
ções, adição de vetores, denotada por + e multiplicação por escalar, denotada por concatenação. A soma opera 
em pares de vetores e retorna um vetor (+ : V x V — V), e a multiplicação por escalar opera em pares de 
escalar e vetor, retornando um vetor (- : K x V — V). Para que V e K com as duas operações formem um 
espaço vetorial as operações devem ter as seguintes propriedades: 


* As duas operações são associativas: 


c(dv) = (cd)v 
u+(vt+tw)=(u+v)+w. 


* A soma de vetores (+) é comutativa: u + w = w + u. 


A multiplicação por escalar (-) é distributiva, tanto sobre adição de vetores como sobre adição de 
escalares: 


c(v +w) = cv +cw 
(c + d)v = cv + dv. 


* Existe um vetor 0, neutro para adição: v + 0 = v. 
* Para todo vetor v existe um vetor —v, tal que v + (—v) = 0. 


* 1v = v (a multiplicação pela identidade do corpo não modifica um vetor). 
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Dizemos que K é o corpo subjacente ao espaço vetorial V. 
O espaço vetorial com um único elemento é chamado de espaço trivial. + 


É de vital importância observar que definimos as operações como + : V x V 5 Ve-:Kx V 5 V,e 
que portanto o vetor que resulta da aplicação delas deve sempre pertencer ao espaço V onde são definidas. 

No espaço trivial, o único elemento deve necessariamente ser o vetor zero, porque a existência do 
neutro aditivo é requisito. 

É interessante observar que não definimos em um espaço vetorial o produto de um vetor por outro, e 
isto está em consonancia com o nome “álgebra linear”: em uma forma linear, ax+b, multiplica-se a variável 
x por um escalar a, mas não pelo próprio x ou por outra variável. Por exemplo, a forma ax? + bx + c é 
quadrática, e não linear. 

A seguir temos exemplos de diferentes espaços vetoriais. Mostramos que são realmente espaços veto- 
riaois: para isso mostramos que as operações de soma e multiplicação resultam em um vetor no mesmo 
espaço, e que as operações tem as propriedades listadas na definição de espaço vetorial. 


Exemplo 1.27 (vetores no plano). O conjunto de todos os vetores no plano com as operações de soma de 
vetores e multiplicação por escalar é um espaço vetorial sobre R, porque: 


* Os vetores são pares de números reais, que podemos representar como vetores coluna. 
* Ocorpo éR 
* A operação de soma de vetores e a de multiplicação por escalar são associativas. 


* A soma de vetores no plano é comutativa (u + v = v + u). 


* Vale a distributividade de - sobre +. Se representarmos os vetores por v = fo >. etc, temos: 
v2 


e[u) + SD] eaé) 
ão (1) DA) 


* O vetor zero, 0 = (o) , quando somado a qualquer outro vetor v, resulta em v. 


* Para todo vetor v há um outro vetor u, de mesma magnitude e orientação oposta, tal que v + u = 0. 
* A multiplicação de um vetor qualquer por 1 não altera o vetor. 


Um vetor no plano é representado por dois números (ordenada e abscissa), e portanto podemos associar 
cada vetor com o produto cartesiano de R com R. Por isso o plano é denotado R?, e o espaço tridimensional 
é denotado R?. De amneira geral, denotamos o espaço de n dimensões por R” (claro, para n > 3 perde- 
mos a possibilidade de visualizar o espaço, mas ainda assim as operações com n coordenadas são análogas 
àquelas em Rĉ e R3). < 


Exemplo 1.28. Considere o conjunto de vetores em RŽ, com as seguintes operações: 


* A operação usual de multiplicação or escalar 


1.4. ESPAÇOS VETORIAIS 


* A seguinte operação de soma de vetores: 


T 


(a, b)" E x% y)" = (Vax, by) 


13 


Se trocarmos a soma de vetores por esta operação, não teremos um espaço vetorial, porque esta operação 


não é associativa, como fica claro ao calcularmos (i) (u H v) E w (a seguir, à esquerda); e (ii) u EB (v Œ w) 
(a seguir, à direita): 

(i) (ii) 
(u Ev) Ew = (yuv, vuv)" E (w1, w2)" uE (v Ew) = (w, u2)" EB (VV, voa) 


= (fi, wa Vi) 


Assim, (R2, EH, -) não é espaço vetorial. 


Antes dos próximos exemplos, demonstramos alguns fatos básicos a respeito de espaços vetoriais. 


Teorema 1.29. Seja V um espaço vetoriale u, v € V. Então 
i) Seu +v = v então u = 0. 

i) 0v = 0. 

iii) Para todo v, —v é único, e —v = (—1)v. 

iv) co = 0 para qualquer escalar c 

v) Existe um únicow E V tal que u + w = v. 
Demonstração. Demonstraremos cada item na ordem em que aparecem no enunciado. 
(6) 


u+v=v 


u+v + (~v) =v +(—v) 


u=0 


(ii) Ov = (0 + 0)v = (0v) + (0v). Pela propriedade anterior - (i) - temos necessariamente v = 0. 


(iii) Sejam —v e v’ dois opostos de v, ou seja, 


—v+v=0 


Então —v e v’ são iguais: 


—v =—v +0 = —v + (v +v’) 


(Vais, yua voaa) 


«4 
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Além disso, temos 
v+ (—1)v = Iv + (—1)v = (1 — 1)v = 0v = 0. 
e portanto = v = (—1)v. 
(iv) ko = k(v + (—v)) para todo v. Usando (iii) que acabamos de provar, temos 


= kv + (—k) (v) 
= (k—k)v 
= 0V, 
que pela propriedade (ii) acima, é igual a 0. 
(v) Sejam u, v, w tais que u + w = v. Então 
u+w=v 


u—u+W=-v—u 


W—-V—uU. 


Como v + (—u) é definido de forma única porque —u é único (conforme a propriedade (iii) acima), w é 
único. E 


Exemplo 1.30 (polinômios). Denotamos o conjunto de todos os polinômios em x com grau < n e coefici- 
entes reais por Rn [x]. 
Polinômios podem ser somados e multiplicados por escalares: 


* A soma de dois polinômios anx” + an x"! +... +agebax" +brax T+... + bo é 
(an +bn)x” + (an-1 +bn-1)x™! + -= (ao + bo). (1.1) 
Por exemplo, 
(ae Lye) + (= +x+1) = (3 — 1)x? + (2+ 0)x? + (0 + 1)x + (—8 + 1) 
= 2x? +2x7+x-—7. 
* A multiplicação de um real k por um polinômio anx” + an—1x"7! +... + ao é igual a 
kanx” +kan x] +... +kao. (1.2) 
Por exemplo, 
7(3e + Ae 1) = 7(3)x + 7(4)x? + 7(-1) 
= 21x) + 28x? — 7. 


Para qualquer n > 0, Rn [x] é um espaço vetorial. 


* Como estamos trabalhando com polinômios reais, consideramos que o o corpo subjacente com sendo 
R. 
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A soma de dois polinômios de grau < n resulta em outro polinômio de grau < n, conforme a equa- 


ção[1.1] 


A multiplicação de um polinômio de grau < n por um escalar resulta em outro polinômio de mesmo 
grau (ou em zero, se o escalar for zero), conforme a equação([1.2] 


A soma de polinômios é associativa: dados tres polinômios p(x), q(x), e r(x), então 


(p(x) + q(x)) + r(x) = p(x) + (q(x) + r(x)). 


A multiplicação de um polinômio por um escalar é associativa: sejam p(x), q(x), e r(x) três polinô- 
mios e c, d números reais. Então 


c[dp(x)] = (ca)p(x) 
p(x) + [alga + MO] = [plx) + q(%)] + (x). 


A soma de polinômios é comutativa: p(x) + q(x) = q(x) + p(x). 


Vale a distributividade da multiplicação sobre a soma. Sejam p(x) e q(x) polinômios e c, d números 
reais. Temos 


p(x) + cq(x) 
p(x) + dp(x) 


cipi) + a(g)] = 


Cc 
(c + d)p(x) = 


O número zero é, ele mesmo, um polinômio, e a soma de um polinômio p(x) com zero resulta em 
p(x). Assim, O é elemento neutro para soma. 


para todo polinômio p(x) com grau < n há um outro, de mesmo grau (—p(x), o polinômio p(x) 
multiplicado por —1), tal que p(x) + (—p(x)) = 0. 


A multiplicação de um polinômio por 1 não modifica o polinômio. < 


Exemplo 1.31. Considere o conjunto de pontos definido no plano pela função y = E Tratamos cada 
ponto como um vetor, e definimos as duas operações: 


soma de vetores 


multiplicação por escalar 


Somamos as primeiras coordenadas dos pontos, e calculamos a segunda. 


(x, 2x?) +(0,2x))=(x+a,2(x + a)?). 


multiplicamos a primeira coordenada do ponto pelo escalar, e calculamos a segunda. 


k(x, 2x?) = (kx, 2[kx]2) 


A próxima figura ilustra geometricamente a operação de soma de vetores; a de multiplicação é análoga. 
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* As operações são associativas; 

* A soma é comutativa; 

* A multiplicação por escalar é distributiva. 

* O vetor (0,0) pertence ao nosso espaço, e é neutro para adição. 

* Todo vetor tem um inverso aditivo: sev = (x, Ey então —v = (—x, E, Temos v + (—v) = (0,0). 
2 


* A multiplicação de um vetor por um não o modifica: 1(x, z x, 5. 


«4 
Exemplo 1.32 (funções). Seja F(R) o conjunto de todas as funções de R em R. Por exemplo, f(x) = 2x, 
g(x) = tan(x) são elementos de F(R). Podemos somar duas funções e multiplicar uma função por um 
escalar: sejam f, g € F. Então, 
* A soma de f com g é f + g, tal que (f + g) (x) = f(x) + g(x). 
* A multiplicação de f por um número real k é kf, tal que (kf) (x) = k(f(x)). 
O conjunto F, com as operações de soma de funções e multiplicação por escalar, é um espaço vetorial: 


* A soma de funções é comutativa: 
(f + g)(x) = f(x) + g(x) = g(x) + f(x) = (g + f)(x). 
* A multiplicação de função por escalar é associativa: 


c(d(f(x)) = (ed)f(x) 
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* A soma de funções é associativa: 


* Vale a distributividade da multiplicação sobre a soma: 
k(f + g)(x) = k(f(x) + g(x)) = kf(x) + kg(x). 
* A função constante f(x) = O é o neutro aditivo: para toda função g, 
(f + g)(x) = f(x) + g(x) = 0 + g(x) = g(x). 
* Toda função f tem um inverso aditivo, que é (—1)f. 
[f + (—1)f] (x) = f(x) + (—1)f(x) = f(x) — f(x) = 0 = z(x), 
onde z(x) é a função constante zero. 


* A multiplicação de uma função por 1 não a modifica. « 


Exemplo 1.33 (números reais, operações trocadas). As operações usadas em espaços vetoriais não preci- 
sam ser a soma e multiplicação usuais. Elas precisam apenas ter as propriedades listadas na definição de 
espaço vetorial. Por exemplo, podemos definir o seguinte espaço vetorial: 


* O conjunto de vetores é R* (os números reais exceto o zero); 

* O corpo usado é R; 

* A operação de soma de vetores é a multiplicação de reais: u $ v = uv 
* A operação de multiplicação por escalar é a exponenciação: c O v = vº 


Neste espaço, o elemento identidade para soma deve ser necessariamente 1: x- 1 = x. O inverso aditivo 
de cada elemento x é x” 1. « 


Exemplo 1.34 (matrizes). O conjunto de todas as matrizes reais m x n, que denotamos Mmxn, é um 
espaço vetorial: podemos somar matrizes e multiplicá-las por escalares reais, e as propriedades necessárias 
são mantidas. Este é um espaço vetorial sobre R, já que os escalares que multiplicamos pelas matrizes são 
reais. A 


Exemplo 1.35. Este exemplo aborda a relação entre os vetores de um espaço e o corpo subjacente, e ilustra 
um fato muito importante. Tentaremos construir um espaço vetorial de duas maneiras parecidas. Uma 
delas funcionará e a outra não. 

Se tomarmos todas as matrizes 2 x 2 com coeficientes reais, mas usarmos o corpo Q para os escalares, 
não teremos problemas. Ao multiplicarmos um escalar racional pela matriz real, obtemos outra matriz 


real, Por exemplo, 
Mim oj- 0 
n (e v2) Jem mv2) 
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Assim, podemos ter o corpo subjacente igual a Q, mas com matrizes reais como vetores. Temos um espaço 
vetorial sobre Q. 

Já o contrário não é possível: suponha que queiramos usar apenas matrizes 2 x 2 racionais e escalares 
reais, portanto V é o conjunto destas matrizes - e excluímos assim todas as matrizes que tem elementos 
irracionais. As operações poderão resultar em matrizes reais: 


al -GA ad) 
3 —2 3V3 —2v3 
Esta última matriz tem elementos irracionais, e não pertence a V, portanto não temos um espaço vetorial. 
< 


Exemplo 1.36 (sequências). Começamos este exemplo com a definição de sequências. 


Definição 1.37 (sequência). Uma sequência é uma função de N* em R. Sequencias normalmente são deno- 
tadas por (an), (bn). O n-ésimo termo da sequência (ou seja, a valor função para o argumento igual a n) 
é usualmente denotado por an, bn, etc, sem os parênteses, ao invés da notação tradicional para funções 
aln), b(n), etc. 4, 


Por exemplo, podemos definir uma sequência (an ): 
q = 2 
an = 2an- + 1 


Temos então a1 = 5, a2 = 11, a3 =23,.... 
Um exemplo bastante conhecido é a sequência de Fibonacci, dada por 


F =1 
= 
Fn = KEN + Fn-2. 


A seguir mostramos os primeiros números da sequência de Fibonacci. 


Fi=1 5-5 
Fz=1 Fę=8 
F; =2 F =13 
E =3 Fs =2] 


Sejam (an), (bn), . . . sequências. Definimos as operações de soma de sequências e multiplicação de sequên- 
cia por escalar da maneira natural: 


* A soma de duas sequências (cn) = (an) + (bn) é sequencia onde cada termo c; é a soma de termos 
a+i+ bi. 


* A multiplicação de uma sequência (an) por um númeor real k é a sequência (cn) = k(an), cujos 
termos são ci = kci. 


Por exemplo, se (an) = (2,4,6,8,...) éa sequencia dos pares começando com dois, e (bn) = (10,20,30,40,... 


é a sequência dos múltiplis de dez, começando com dez, então 


(an) + (bn) = (12,24,36,48,...) 
3(an) = (6, 12,18, 24,...) 


Então o conjunto de todas as sequencias é um espaço vetorial: 
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i) a soma de sequências é associativa e comutativa; 
ii) a multiplicação de sequência por escalar é associativa; 
iii) a sequência zn = O é neutra para soma de sequências; 
iv) para toda sequência (a, ), existe uma sequencia (—a,) tal que (an) + (~an) = (Zn). < 


Exemplo 1.38 (soluções de equação diferencial). Uma equação diferencial ordinária é uma equação envol- 
vendo uma função e uma ou mais de suas derivadas. Uma resumida introdução às Equações Diferenciais é 
dada no Apêndice[ô] 
Considere a equação diferencial 
y”=y=0. (1.3) 


* A equação é linear, porque é da forma any! +an-1y "=D +--+ ary + ao = f(x). 


* A equação é homogênea, porque apenas a variável dependente aparece na equação - não vemos a 
variável independente nem constantes (ao = 0, f(x) = 0). 


As soluções da equação[1.3|são da forma 


porque para todo x € R, 

ddr pes IN pes — 
a ae e EM ae be” = 0. 
onde a e b são constantes arbitrárias. As soluções formam um espaço vetorial: a soma de duas soluções 
resulta em outra solução - sejam (a,b) e (a, B) as constantes que determinam duas soluções diferentes para 
a EDO. Então 


ae* —-be * + ae*-Be*=(a+oje*-—(b+B)e* 


A multiplicação por escalar também resulta em outra solução: 
c(ae* + be *) = (ca)e* + (cb)e *. 


Finalmente, as propriedades de espaço vetorial valem: (i) a soma de soluções é associativa e comutativa; 
(ii) a multiplicação por escalar é associativa; (iii) y = O é solução (com a = b = 0), e funciona como neutro 
aditivo; (iv) toda solução tem oposto - basta multiplicá-la por —1; (v) multiplicar 1 por uma solução não a 
modifica. 

O conjunto de soluções para qualquer EDO linear homogênea é sempre um espaço vetorial. 

Uma excelente introdução às Equações Diferenciais é o livro de Tenenbaum em Pollard [TP63]. Mais 
resumidos, os livros de Coddington e Bear são também ótimos textos sobre o assunto. « 


Exemplo 1.39 (variáveis aleatórias). Seja O o espaço amostral de um experimento aleatório. Uma variável 
aleatória real é uma função X : O > R. 

Por exemplo, se o espaço amostral é o conjunto de pessoas em um prédio, a função que mapeia cada 
pessoa em sua massa corporal é uma variável aleatória. 

O conjunto de todas as variáveis aleatórias em O é um espaço vetorial quando usamos a operação usual 
de soma de variáveis aleatórias, e a multiplicação de uma variável aleatória por escalar real. 

Sejam A e B duas variáveis aleatórias definidas no mesmo espaço amostral O, e seja C = A + B. Para 
todo evento simples w € O, C(w) = A(w) + B(w). Fica portanto claro que: 
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* A soma de variáveis aleatórias é associativa e comutativa. 
* A multiplicação de variável aleatória por escalar é distributiva sobre a soma. 
* A variável aleatória Z, que leva todo elemento de O em 0, é o elemento neutro para adição. 


* Se A é variável aleatória, então a variável aleatória — A, que leva os elementos do espaço amostral 
aos valores opostos aos que A leva, também é. 


* Multiplicar uma variável aleatória por 1 não a modifica. 


Mostramos então que o conjunto das variáveis aleatórias reais em um mesmo espaço amostral é um espaço 
vetorial sobre R. < 


Exemplo 1.40 (sequências de bits). Mencionamos no exemplo o corpo Z2, onde as operações são o 
“e” (AN) e o “ou-exclusivo” (&). Definimos agora um espaço vetorial sobre este corpo, de maneira análoga 
a R” sobre os reais. Cada vetor é uma sequência de n bits, e as operações são: 


* Soma: é feita elemento a elemento - somar o vetor b = (by, bz,...,bn)comovetorb' = (bj, b5,..., b1) 
resulta em (b1 $ bj,bz & b5,...,bn ® b/). Por exemplo, 


(0,1,0,1,1) 
& (0,0,1,1,0) 
5 (0,1,1,0,1) 

* Multiplicação por escalar: é feita elemento a elemento - multiplicar c pelo vetor (by, b2, ..., bn ) re- 
sulta em (cby, cbz,..., cbn). Como há somente dois escalares no corpo (0 e 1), listamos aqui o efeito 
da multiplicação de vetores por eles. 

1 A (b1, b2,..., bn) = (b1, b2,..., Dn) 
0A (b1,b2,...,bn) = (0,0,...,0). 
Este espaço é chamado de Z}. « 


Exemplo 1.41 (ciclos em grafo). Um grafo é uma representação gráfica de uma relação em um conjunto. 
Grafos tem aplicação em uma enorme quantidade de áreas das Engenharias, da Computação e da Matemá- 
tica. A figura a seguir mostra exemplos de grafos. 
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HA 


É usual dar nomes aos nós, e desenhar o grafo com os nomes de cada nó seu lado. 

Para poder trabalhar com grafos como objetos matemáticos, precisamos dar a eles uma definição for- 
mal. Definimos um grafo como um par (V, E), onde V éum conjunto de vértices (representados grafica- 
mente como “pontos”) e E um conjunto de arestas (graficamente são os “traços” que unem vértices), de 
forma que cada aresta em E seja um conjunto de dois dos vértices em V. 

Damos um exemplo de grafo na próxima figura. 


b 


O conjunto de vértices do grafo é 
V = {a, b,c, d, e, f}. 
As arestas são 
E= fir ch {a,d}, (b, E 
tb,e), {b,f}, {c,d} 

Um subgrafo é uma “parte” de um grafo. 
Definição 1.42 (subgrafo). Seja G = (V, E) um grafo. Um subgrafo de G é um grafo G' = (V’, E’) tal que 
V'CVeE'CE. + 

O grafo em negrito na figura a seguir é um subgrafo do grafo anterior. Neste texto, quando quisermos 


mostrar um subgrafo, ele será desenhado em negrito sobre o grafo original, que será desenhado em tom 
de cinza claro. 


b 
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O vetor característico de um conjunto de arestas é um vetor com E posições. A posição i do vetor é um se e; 
está no subgrafo, e zero se não está. Por exemplo, o vetor característico do subgrafo que mostramos é 


{a,b} > 
ta, cy > 
ta, dq} > 
{a e} > 
{a, f} > 
{b,c} > 
tb, d} > 
{[b, e} —> 
{b, f} > 
{c, d} > 
{c, e} —> 
{c, f} > 
{d, e} > 
{d, f} > 


Oooooa mao EQT OOo O= o 


Os elementos do vetor característico são Oe 1. Será conveniente usarmos as operações de Z2 nestes vetores. 
Multiplicar um vetor por 1 é o mesmo que realizar a operação de “e”, e portanto resulta no mesmo vetor 
(não modifica o subgrafo): 


1- (0,1,1,0,0,1)" = (0, 1,1,0,0,1)". 


A multiplicação por zero resulta no vetor zero (e portanto no grafo sem arestas, contendo somente os 
vértices), ou seja, multiplicar um subgrafo por zero o faz “desaparecer”. 

A soma de dois vetores é feita elemento-a-elemento, com a operação de soma em Zz (ou seja, usando 
ou-exclusivo): 


(0,1,1,0,0,1)" 6(1,1,0,1,0,1)] =(1,0,1,1,0,0)". 


Em um grafo, esta operação representa a soma de dois subrafos: se uma aresta existe somente em um dos 
subgrafos, ela passa a existir na soma. Se uma aresta existe nos dois subgrafos, ela deixa de existir na soma. 
A figura a seguir ilustra a soma de dois subgrafos. Observe que as arestas (a, b), (b, c) e (d, e) existiam em 
ambos os grafos, e não existem na soma (elas aparecem em cinza claro na ilustração, apenas para facilitar 
sua identificação). 


a a 
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Um ciclo em um grafo é uma sequência de arestas (e1, e2,..., ex) formam um caminho, iniciando com um 
vértice e terminando nele mesmdf] A figura a seguir ilustra um ciclo em um grafo; o ciclo é formado pelos 
vértices (a2, a3, by, bo). 


bz 


“e ao / 
j 


/ 


/ 


eb, 


Quando somamos dois grafos, cada um composto por ciclos disjuntos (isto é, ciclos que não compartilham 
arestas), o resultado também é um grafo composto por ciclos disjuntos. Não demonstraremos este fato, mas 
ilustramos com um exemplo. A figura a seguir mostra dois grafos, G e H. Estes grafos tem dois vértices (c 
e d) e uma aresta (c——d) em comum. 


a e 

c j h 

n= «. Rs i 
b g 


O resultado da soma dos dois grafos, G & H, é mostrado a seguir. 


“Esta definição está simplificada. Para mais detalhes, o leitor poderá consultar a literatura de Teoria dos Grafos - por exemplo, o 
livro de Bondy e Murty |BMOo8 
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b 


Seja C a união dos subgrafos sem arestas com o conjunto dos subgrafos de G que consistem de uniões de 
ciclos. C com as operações que definimos é um espaço vetorial sobre Z2: 


* Grafos sem arestas são o elemento neutro (zero), e sua soma com qualquer outro grafo de ciclos 
resulta no próprio grafo de ciclos; 


* A soma de dois ciclos resulta em um ciclo; 


* A multiplicação de um elemento por 1 resulta no próprio elemento; por O resulta no grafo sem ares- 
tas. < 


1.5 Subespaços 


Definição 1.43 (Subespaço). Seja V um espaço vetorial, e seja também U C V. Se as mesmas operações 
que tornam V um espaço vetoria[”|também tornam U um espaço vetorial, então U é umsubespaço de V. 4 


Teorema 1.44. Todo espaço vetorial V não trivial tem pelo menos dois subespaços: o próprio V e o espaço trivial, 
Demonstração. O espaço trivial é subespaço de qualquer espaço V porque 

e {0}C V. 

* Como só há um elemento no espaço trivial, não há vetores a somar. 

* A multiplicação de qualquer escalar por 0 é associativa: (cd)o = c(d0) = 0. 

* O zero é neutro para adição (0 + 0 = 0). 

* Para todo vetor no espaço trivial (ou seja, somente para o zero), 0 + —0 = 0. 

* A multiplicação de 1 por 0 é igual a O (ou seja, não modifica o vetor zero). 

Claramente V também é subespaço de V, porque V C V. E 


Exemplo 1.45. Considere o espaço Rº. O conjunto de pontos da forma (v1 , v2, 0) é um subespaço, porque: 
(i) a soma de dois pontos desta forma resulta em outro também da mesma forma: (u1, u2, 0)+ (v1,V2,0) = 
(u1 + vi, u2 + v2,0), e (ii) a multiplicação por escalar também resulta em outro ponto da mesma forma: 


7alguns autores dizem que U é “munido” das mesmas operações de V. 
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c(v1,v2,0) = (cvy, cv2,0). Além disso, (i) a soma de vetores (os pontos) é associativa e comutativa; (ii) a 
multiplicação de vetores por escalar é associativa: 


c(du) d(11,u2,0)) 


dus, dus, 0) 


+ 


c 
c 
(cduy, cduz,0) 
(cd) (ur, u2, 0) 
(cdJu, 


u+ (v+w) = u1, U2,0) E [(v1,v2,0) + (w1,w2,0)] 


= (11,112,0) + (vi + wa, vz + w2,0) 

= (u1 +vı + Wi, U2 +V2 + W2,0) 

= [(uy + vista + v2,0)] + (w1, w2,0) 
= [(u1,12,0) + (vi, v2,0)] + (w1,w2,0) 
= (u+v) +w; 


(iii) a multiplicação por escalar é distributiva: 
c(u+v) =c[(u1,u2,0) + (v1, v2,0)] 
= c(ui , U2, 0) Sia c(vi ) V25 0) 
=cu+cv, 


(c + d)v = (c + d)(vi,v2,0) 
= c(vi Yv2,0) + d(vi 5V2,0) 
= cv + dv; 


(iv) o vetor O = (0, 0, 0) é neutro para soma; (v) para todo vetor (uy, 12,0) existe um vetor (—u1 , —u2,0) 
tal que (uy, u2, 0) + (~u1, —u2, 0) = 0; (vi) multiplicar 1 por um vetor v não modifica o vetor. 

Este exemplo mostra também que podemos visualizar R como subespaço de R? uma vez que igno- 
rando a terceira coordenada (que é igual a zero), temos um plano. < 


Exemplo 1.46. Sabemos que os reais são um espaço vetorial (os vetores são números reais, e o corpo 
subjacente é o próprio R). Os racionais não são subespaço dos reais, porque a multiplicação de x € Q 
por escalar real não necessariamente é racional: 7 - (2/3) = 27/3. < 


Se sabemos que V é um espaço vetorial e U C V, já sabemos também que todas as propriedades das 
operações em V também valem em U (porque as operações são as mesmas). Resta apenas determinar se 
este subconjunto é fechado para as operações de soma de vetores e multiplicação por escalar. Para isso, 
verificamos que: (i) o vetor zero pertence a U; (ii) as operações de soma e multiplicação por escalar de 
elementos de U resultam em elementos também de U. 

A figura a seguir mostra, por exemplo, dois subconjuntos de um espaço vetorial V. No primeiro caso, 
U é subconjunto, mas há vetores x e y tais que x + y = z ¢ U. Como esta condição já não é satisfeita, 
podemos dizer que U não é subespaço de V. No segundo caso, a soma de quaiquer x e y está em W, o zero 
está em W, e para todo x e todo c, cx está em W, portanto W é subespaço de V. 
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Teorema 1.47. Se V é um espaço vetoriale U C V, de forma que O € U e U é fechado para as operações de 
multiplicação por escalar e soma de vetores, então U é subespaço de V. 


Exemplo 1.48. Considere o subconjunto de Rĉ?, X = { (x,y): x+y = 0}. X é subespaço de R?, porque 
(0,0) € X; a soma de dois vetores de X resulta em outro vetor de X. Sejam (a, b) e (x,y) pontos de X. 


(a,b) + (x,y) J- (a+x,b +y) 

Somando as coordenadas do novo vetor, temos 
(a+x)+(b+y)=(a+b)+(x+y)=0+0=0. 
a multiplicação de vetores de X por escalar resulta em outro vetor de X. Seja (x,y) vetor em X e c um 
escalar. 
c(x, y) = (cx, cy) 

Então 

cx + cy ~e + y) = 0c = 0. 


O conjunto X definido acima é a reta y = —x. Há outras retas que são subespaços de R?: basta que passem 
pela origem (porque precisamos do vetor 0). 

Geometricamente, podemos verificar que a adição de vetores nesta reta resulta sempre em outro vetor 
também sobre a mesma reta - e que a multiplicação por escalar também mantémos vetores na reta. Como 
além disso a reta pasa pela origem, o vetor zero está também na reta, e portanto, como soma e multiplicação 
por escalar resultam em vetores na reta, e ela contém o zero, trata-se de um subespaço de R?. 
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O raciocínio geométrico que fizemos obviamente vale para qualquer reta passando pela origem (e real- 
mente, são todas subespaços de R?). 
De maneira geral, o conjunto ((x1,x2,...,Xn): > x; = 0 }é subespaço de R”. < 


Exemplo 1.49. Considere o conjunto de pontos X = { (x,y): x+y = 1}. X é subconjunto de R?, mas 
não é um subespaço de R?, porque 


i) (0,0) ¢ X. 
ii) A soma de dois vetores de X não resulta em outro vetor de X. 


iii) A multiplicação de um vetor de X por escalar não resulta em outro vetor de X. 


Exemplo 1.50. Considere o conjunto de pontos X = { (x,y): x,y € Z } ilustrado na figura a seguir. 
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X é subconjunto de R?, mas não é um subespaço de R2, porque a multiplicação de um vetor de X por escalar 
real não resulta em outro vetor de X. Os escalares em um espaço vetorial não podem ser inteiros, porque 
isto seria o mesmo que definir o espaço vetorial sobre Z, que não formam um corpo. < 


Exemplo 1.51. Considere o subconjunto de Rê, X = (x, 2x, x4)", ou seja, vetores onde a segunda coor- 
denada é o dobro da primeira e a terceira é o quadrado da primeira. X não é um subespaço vetorial de R3, 
porque (1,2,1)" e (2,4,4)! pertencem a X, mas sua soma, (3, 6,5)! não pertence a X (porque 32 #5). « 


Exemplo 1.52. Parar € R, o conjunto de pontos em uma circunferência, C = (x? + y2 < r? } não é 
subespaço de RŽ: a multiplicação por escalar leva pontos de C a pontos fora de C: para todo r podemos 
encontrar um c tal que cx? + cy? > r. Geometricamente, o conjunto C define os vetores dentro de uma 
circunferência com raio r - e qualquer vetor em C diferente de zero pode ser multiplicado por algum escalar 
grande o suficiente para passar a ter magnitude maior que o raio. < 


Exemplo 1.53. Podemos também voltar a atenção para o conjunto das funções contínuas cujo domínio é 
R, que é denotado Cº. 

Para verificar que C? é um espaço vetorial, verificamos que é um conjunto de funções de R em R, e 
portanto valem os argumentos postos nos itens do exemplo[1.32]- e de fato, este conjunto é subconjunto 
de F(R). No entanto, como o conjunto é diferente, precisamos garantir a presença do vetor (função) zero 
e o fechamento das operações: 


* A função constante zero, z(x) = 0, é contínua e está definida em R. 
* A soma de duas funções contínuas definidas em R também é contínua em R. 


e A multiplicação de uma função contínua por um escalar resulta em outra função, também contínua. 
< 


Exemplo 1.54. Uma função contínua pode não ser diferenciável (como |x|, por exemplo) ou pode ser de- 
rivável k vezes (onde k pode ser infinito). O conjunto de funções k vezes diferenciáveis (ou seja, para as 
quais a k-ésima derivada é definida) é denotado por CH. 

Verificamos que CK é um espaço vetorial: 


* A função constante zero, z(x) = 0, é derivável infinitas vezes. 


* A soma de duas funções com a k-ésima derivada definida será uma função também k vezes derivável. 
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* A multiplicação de uma função com a k-ésima derivada definida por um escalar resulta em outra 
função, também k vezes derivável. < 


Exemplo 1.55. O conjunto das funções f : R — R contínuas em um dado intervalo [a, b] é denotado por 
Cla, b]. Para qualquer intervalo [a, b] não-vazio de R, Cla, b] é um espaço vetorial. 

Para verificar que este é um espaço vetorial, observamos inicialmente que este não é um subconjunto 
de F(R), porque os domínios das funções são diferentes: f : R > R, f(x) = x? é diferente de g : 
[a,b] > R, g(x) = x2. No entanto, podemos argumentar que o conjunto formado pelas funções em 
F(R), restritas ao intervalo [a, b] é um espaço vetorial, e que Cla, b] é subespaço desse conjunto, pelos 
mesmos argumentos que apresentamos para mostrar que Cº é subespaço de F(R). < 


Exemplo 1.56. Vimos no exemplo que o conjunto de soluções de uma EDO linear homogênea é um 
espaço vetorial. Mencionamos ali também que as soluções de 


y”—y=0 


são as funções da forma 
O conjunto de funções 


é subespaço das soluções para esta EDO: 
* A função zero é da forma ae*, com a = 0; 
* A soma é fechada: ae* + «e* = (a + a)e*; 
* A multiplicação por escalar é fechada: k(ae*) = (ka)e*. 


A solução geral especifica duas constantes arbitrárias, a e b. Fixando qualquer uma delas em zero, temos 
um subespaço. < 


Exemplo 1.57. As funções pares, ímpares, racionais e as funções definidas por polinômios são também 
subespaços de F(R). < 


Exemplo 1.58. Considere o sistema homogêneo de equações lineares, com n variáveis e m equações. 


Q11X1 + Q12X2 +*+ AinXn =0 
d21X1 + d22Xx2 ++: + a2nX%n =0 


AmiX1 + Am2X2 +: + AmnXn =0 


O mesmo sistema pode ser escrito da forma Ax = 0, onde A é uma matriz m x n, com o coeficiente ai; 
na linha i e coluna j, x é o vetor coluna (x1,...,Xn)! e 0 é o vetor coluna zero. Assim, podemos dizer 
que as soluções para Ax = 0 são todos os vetores coluna x € R” que satisfazem o sistema homogêneo de 
equações definido por A. Este conjunto de vetores é subespaço de R”, como verificamos a seguir. 

Faremos a demonstração de duas maneiras: primeiro, com o sistema na forma de equações, e depois 
usando a forma matricial. 
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i) A solução com xı = x2 =--- = Xn = 0 sempre é válida para sistemas homogêneos (ou seja, o vetor 
0 sempre é solução). Para cada linha i, temos 


Qi1X1 + Qi2X1 +: + dinXn 
= ajn(0) + ai2 (0) +: + ano) 


=0. 

ii) Asoma de duas soluções é uma solução: Sejam (x1,x2,...,Xn)e (Y1, Y2,- - - , Un) duas soluções para 
o sistema. Então (x1 + y1,x2 + U2,...,Xn + Un) também é solução: para cada linha i, verificamos 
que 

aii (xı +y1) + ai2(x2 +yY2) +: + ant +yn) 
= 41X1 + Qi1Y1 + Qi2X2 + Qi2Y2 ++ F dinXn + AinyYn 
= (aux + dizX2 + **: + dinXn + Cir) + (auy F djzyz Fie + QinUnd GinYn) 
=0. 


iii) A multiplicação de uma solução por escalar resulta em outra solução. O exercício[25|pede a demons- 
tração deste item. 


i) A solução com x = 0 sempre é válida para Ax = 0, porque A0 = 0. 
ii) A soma de duas soluções é uma solução: Se Ax = 0 e Ay = 0, então 
A(x +y) = Ax + Ay (multiplicação é distributiva para matrizes) 
=0+0 
=0. 
iii) A multiplicação de uma solução por escalar resulta em outra solução. Se Ax = 0, então 


A(kx) = kAx 
= k0 
= 0; 


Note que sistemas homogêneos de equações lineares podem ser também definidos com coeficientes e variá- 
veis em corpos diferentes de R. Assim, As soluções de um sistema deste tipo onde as variáveis e coeficientes 
são complexos formam um subespaço de C”, e de maneira geral, a soluções de um sistema como este em 
um corpo K qualquer é subespaço de K”. < 


Exemplo 1.59. No espaço Z3, os vetores da forma 0xxx0 (ou seja, o primeiro e último elemento são zero) 
formam um subespaço: 


* O vetor zero - 00000 está contido no subespaço; 
* A soma Oxxx0 & Oyyy0 resulta em um vetor da forma 0zzz0; 


e A multiplicação por escalar também resulta em vetores da mesma forma: 0 A (0xxx0) = (00000), e 
TA (0xxx0) = 0xxx0. < 
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Exemplo 1.60. Considere o espaço Z5: O conjunto a seguir é seu subespaço: 
C = (0000,0011,1101,1110). 
e 0000 € C. 
* A soma (9) de elementos de C resulta em outro elemento de C: 


001641101 = 1110 
0011 $ 1110 = 1101 
1101 & 1110 = 0011 


Além disso, a soma de qualquer vetor com ele mesmo resulta em 0000, e a soma de qualquer vetor 
com zero resulta no próprio vetor. 


* A multiplicação (^) pelos escalares resulta em elemento de C: 0A x =0e1 Ax =x. 


Teorema 1.61. Sejam U, W subespaços de um espaço vetorial V. Então U N W também é subespaço de W. 


Demonstração. Como ambos são subconjuntos de V, basta mostrar que U N W é fechado para as operações. 
Sejam x,y € U N W e c um escalar. Como x € Uex € W, temos cx € Ue cx € W, e portanto 
cxe UNW, 
Similarmente, como x,y estão tanto em U como em W, x + y também devem pertencer a U e a W. 
Concluímos que x +y € UN W. E 


Exemplo 1.62. Considere os subespaços de R3: 
A=((xwy0)': xyeR) 
B={(x ad : LYERA. 


Estes subespaços são planos passando pela origem. A interseção deles é R = { (x,y, 0)" : x €R }, que 
também é subespaço de Rº. «4 


Exemplo 1.63. Seja À o espaço das matrizes diagonais de ordem tres, e Bo espaço das matrizes quadradas 
de ordem tres com traço zero. 

A interseção A N B é o conjunto das matrizes diagonais de ordem tres com traço zero. Este é, também 
um espaço vetorial, com as mesmas operações usuais de soma de matrizes e multiplicação por escalar. « 


Exemplo 1.64. Seja F(R) o espaço vetorial das funções reais. Considere dois subespaços de F(R): 
i) O conjunto das funções reais contínuas, Cº; 
ii) O conjunto das funções reais pares P. 


A interseção desses dois é formada pelo conjunto das funções reais contínuas pares. Esta interseção é 
também subespaço de F(R): 


* A função constante zero é contínua e par; 
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* Multiplicar uma função contínua e par por um escalar resulta em outra função contínua e par; 
* A soma de duas funções contínuas pares é uma função contínua par. «4 


Exemplo 1.65. Seja A o espaço de todas as sequencias reais constantes, e B o espaço de todas as sequen- 
cias de números inteiros pares. A interseção dos dois conjuntos é o conjunto das sequencia de constantes 
inteiros pares, que é também espaço vetorial. < 


Definição 1.66 (Soma de espaços vetoriais). Se V é um espaço vetorial e U, W C V, então dizemos que 
u+W=(lu+w:ueU, we W) 
é a soma de U e W. + 


Exemplo 1.67. Os conjuntos A, da forma (0, x,y, 0)", B da forma (0,0,y, z)" são subespaços de R4. A 
soma destes dois subespaços é 
A+B=(u+v: ucA,veB). 


o conjunto A + B contém vetores da forma (0,x,y,0)! + (0,0, y,z)", que é o mesmo que (0,x, 2,2)", 

ou (0,x,y,Z)! - a primeira coordenada é zero, e as outras três são livres (nenhuma depende da outra). 
Note que há muitos vetores em A N B. Por exemplo, (0,0,1,0)! está tanto em A como em B, assim 

como (0, 0, 2,0)" - na verdade, (0,0,c,0)! € AN B paratodoc € R. < 


Definição 1.68 (Soma direta). Seja um espaço vetorial V com subespaços U e W. Dizemos que V é soma 
direta de U e W se V é soma de U e W,e UN W ={ 0 }. Denotamos a soma direta por V = US W. 4 


Proposição 1.69. Seja V um espaço vetorial com subespaços U e W. Então V = U 6 W se e somente se, para todo 
v € V, existe um únicou € Ue um únicow € W tal que v = u + w, 


Exemplo 1.70. Seja A o subespaço de R? formado pelos vetores da forma (x, y, 0)", e seja B o subespaço 
de R? formado por vetores da forma (0,0, z)". Qualquer vetor de R? pode ser descrito de forma única 
como a soma de um vetor de A com outro de B: 


(x,y, z)" — (x,y, 0)" E (0,0,2)", 


portanto R? = A & B. Outra maneira de decompor R? é em três subespaços, X, Y e Z, contendo vetores 
da forma (x,0,0)!, (0,,0)! e (0,0,z)!, respectivamente. Um vetor de R? então pode ser decomposto 
unicamente em 

(x,y, z)" = (x, 0,0)" + (0,y, 0)! + (0,0, zji: 


Podemos generalizar, definindo que para qualquer n, R” pode ser decomposto em subespaços onde cada 
subespaço representa algumas das dimensões: 

(vi VB, ++ Vn)! = (v1,0,0, . JE 
+ (0, v2, V3; 0, 0, as J 


EON RM se 


De maneira geral, R? pode ser decomposto na soma direta de três retas não colineares, ou de um plano e 
uma reta não pertenente a este plano (todos sempre passando pela origem). < 
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Exemplo 1.71. A soma do exemplo[1.67|não é soma direta, porque um vetor (0, a, b, c) em A + B pode ser 


decomposto de diferentes maneiras: 


(0, a,b, c)! = (0, a,b,c)" + (0,0,0,0)" 
= (0, a,0,c)" e (0, 0, b, 0)" 


= b T b T 
nl (0, a, 20) F (0, 0, 28) 


«4 


Exemplo 1.72. Os conjuntos A = ((xy)!: x+y =0}e B = { (x,y)! : x—y = 0) descrevem duas 


retas em R?, ambas contendo a origem. 


Então 
A+B={(x,y): x+y =00ux—-y=0}, 


mas como A N B ={0}e A + B = R?, logo temos 


AGB=A+B=R?, 


Podemos também observar que é possível escrever qualquer vetor de R? como soma de um vetor dentro 


de cada reta na figura. 


< 


Exemplo 1.73. Seja Rn [x] o espaço vetorial dos polinômios com grau máximo n e coeficientes reais. Con- 


sidere os dois subconjuntos de R [x]: 


* Rm-1 lx), o espaço dos polinômios com grau máximo m — 1; 


* Rm..n lx], o espaço dos polinômios com grau entre m e n, mais o polinômio zero, com 0 < m < n. 


Qualquer polinômio de Rn [x] pode ser descrito unicamente como a soma de um polinômio de Rm (x) 


com outro de Rm..n [x]: 


anx” ap 


ERm..n [x] ERm—1 [x] 


ME +am-1x™! +... +a1x + ao 


= (anx" + an—1x™ S. + amx™) + (Ga! +... + ax + ao). 
— n a a 
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Note que o lado esquerdo pode ser zero (que pertence a Rm. .n [x]) se todos os coeficientes ali forem zero. 
Assim, temos Rn [x] = Rm ix] S Rm..nlx]. 

Mais concretamente: seja R4 [x] o conjunto de todos os polinômios com grau no máximo 4. Então R4 [x] 
pode ser decomposto, por exemplo, em 

* R2[x], o espaço dos polinômios com grau máximo 2; 

* R3..4[x], o espaço dos polinômios com grau entre 3 e 4, mais o polinômio zero. 


Qualquer polinômio de grau menor ou igual a quatro pode ser escrito como a soma de (i) um polinômio de 
grau entre 3 e 4, ou zero, e um polinômio de grau no máximo 2: 


ax! + a3x2 + a2x? + ax + do 
= (aqx" + a3x?) 4 (ax? H ax + ao). < 
—_— A N Č 
ER3..4 [x] ER2[x] 


Exemplo 1.74. Sejam 
i) A o espaço gerado pelas sequencias de bits 0110 e 1001; 


ii) B o espaço gerado pela sequencia de bits 0100; 


iii) C o espaço gerado pela sequencia de bits 1000. 
O espaço Z3 é iguala A & B @ C. Temos 
A = (0000, 0110,1001,1111), 
B = {0000, 0100}, 
C = {0000, 1000}. 


Qualquer vetor (sequencia de bits) de Z4 pode ser escrita como soma de vetores desses conjuntos. < 


1.6 Aplicações 


Esta Seção detalha três exemplos práticos do uso de estruturas algébricas: o primeiro e o terceiro em Crip- 
tografia; o segundo na determinação de um método para resolver o cubo mágico (ou cubo de Rubik); o 
terceiro em Criptanálise; e o último em códigos corretores de erros. Grupos são também muito usados em 


algumas áreas da Química e da Física [Bis93||[Ham89}[Cor97]. 


1.6.1 Protocolo Diffie-Hellman para acordo de chaves [ grupo ] 


A Criptografia nos oferece métodos para realizar comunicação privada, mesmo que o canal (meio) usado 
seja público. Por exemplo, podemos usar Criptografia para enviar mensagens secretas pela Internet, e 
para acessar sistemas bancários sem que intrusos obtenham nossa senha, e poderíamos citar uma grande 
quantidade de outras situações onde a Criptografia nos protege, garantindo sigilo. 

Antes da era moderna da Criptografia, o método usado para encriptar e decriptar mensagens envolvia 
apenas uma chave secreta: se uma mensagem é encriptada com chave (“senha”) k, ela pode ser decriptada 
por qualquer um que conheça aquela chave. 

Suponha que Alice e Bob queiram trocar mensagens em segreddf] mas estejam fisicamente distantes 


SÉ comum em Criptografia darmos nomes aos dois usuários de um sistema criptográfico de “Alice” e “Bob”, 
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(em países diferentes, por exemplo). Suponha também que eles só podem se comunicar por um canal 
inseguro: cartas que são bisbilhotadas pelo serviço secreto, telefone grampeado, ou conexão insegura por 
rede de computadores. Aparentemente é impossível que os dois consigam fazê-lo sem se encontrarem 
fisicamente, porque teriam que definir uma chave secreta para poderem encriptar as mensagens - e ambos 
precisam conhecer a mesma chave. 

Em 1976, Whitfield Diffie e Martin Hellman mostraram como resolver este problema, apresentando um 
método para que duas pessoas possam definir conjuntamente um segredo, comunicando-se apenas por 
canais públicog?| Este método foi publicado com o título “New directions in Cryptography” [DH76]. Hoje 
o método é conhecido como protocolo Diffie-Hellman para acordo de chaves. A seguir descrevemos de maneira 
simplificada o método desenvolvido por eles. 

Alice e Bob deverão portanto determinar, de comum acordo, um segredo (a chave criptográfica para 
se comunicarem, por exemplo) - mas que só podem se comunicar em público (postando recados em um 
quadro de avisos, usando uma linha telefônica grampeada, ou através de uma rede de computadores des- 
protegida). 

O protocolo Diffie-Hellman usa operações em um grupo. Para um exemplo simpleg”] usaremos um 
grupo definido da seguinte forma: o conjunto de elementos é( 1,2,...,p — 1 }, onde p é um número primo. 
A operação de grupo para dois elementos ae b é a - b = resto da divisão de ab por p. Por exemplo, se 
p = 7, então para calcular 5 - 6, fazemos 5 x 6 = 30, e tomamos o resto da divisão de 30 por 7, que é 2. 

Observe que como p (neste exemplo, 5 é primo), o resultado da operação nunca será zero, portanto 
nunca obteremos um elemento fora do 


Exemplo 1.75. Escolhemos, para fins didáticog!] p = 5. Os elementos do grupo são {1,2,3,4}. 
Calculamos como exemplo 2 - 2. Temos 2 x 2 = 4, e o resto de4- 5 é 4, portanto 2 .2 = 4. 
Agora calculamos 3 - 2. Temos 3 x 2 = 6. O resto de 6 = 4 é 2, portanto 3 - 2 = 2. « 


Em grupos definidos desta forma, sempre haverá pelo menos um elemento g que podemos usar para 
escrever todos os outros elementos usando a operação de grupo. Chamamos este elemento de gerador do 
grupo. No exemplo anterior, podemos escrever todos os elementos usando somente g = 2. Por exemplo, 


* O elemento 4 pode ser escrito como 2 - 2, porque calculamos 2 x 2 = 4, e o resto de 4 + 5 é 4. 


* O elemento 3 pode ser escrito como 2 - 2 . 2: 


2:2.2=(2.2).2 (a operação é associativa) 
=4.2 (já calculado antes, 2 - 2 = 4) 
= resto de 8+ 5 
=3. 
O mesmo pode ser feito para o elemento 1: 
A2- 2-2= (2.2) 2) (a operação é associativa) 
=4.4 (já calculado antes, 2 - 2 = 4) 
= resto de 16 — 5 
=> 


?0 método funciona de forma que duas pessoas poderiam usá-lo em uma sala com diversas outras pessoas: os dois participantes 
ditam em voz alta números um ao outro, e depois de um tempo ambos conhecem um segredo que ninguém mais na sala conhece. 
10Em situações práticas, há diversas restrições quanto à forma como o grupo é definido; a apresentação do protocolo neste texto 
foi simplificada. 
Hwa prática, p deve ser muito grande. 
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Vemos portanto que podemos escrever todos os elementos usando somente 2: 


2=2 

4=2.2 (2 x 2 = 4. Restode4-5é4) 
3=2.2.2 (Resto de8 = 5 é3) 
1=2:2.2.2 (Resto de 16 = 5 é 1) 


a vezes 


É comum usar a notação g! para 999 --- 9, portanto 


2=2! 
4=2? 
3=2º 
1=2º 


Em grupos como este, calcular gº a partir de g e a pode ser feito rapidamente, mas calcular a a partir de 
gº é extremamente demorado: para p perto de 22º48, um computador demoraria centenas de anos para 
terminar o cálculo. 


Depois de definir p e determinar g (que podem ser públicos), Alice e Bob seguem os passos a seguir. 
1. Alice escolhe aleatoriamente seu segredo, 1 < a < p. 

2. Bob também escolhe seu segredo, 1 < b < p. 

3. Alice envia para Bob gº. 

4. Bob envia para Alice g”. 

5. Alice, tendo o valor enviado por Bob, calcula (g")º, que é igual a gº? (verifique!). 

6. Bob faz o mesmo, e calcula (gº)?, obtendo também gº?. 


Agora Alice e Bob tem o mesmo valor, g“º, que pode ser usado como senha, porque é conhecido apenas 
por eles. Os dados enviados em público e que podem ser capturados pelo adversário são g% e g?, mas com 
estes dois valores seria difícil calcular a, b ou 9º”, e portanto Alice e Bob atingiram seu objetivo. 

O grupo que apresentamos neste exemplo não é o único usado com o protocolo Diffie-Hellman - em 
aplicações práticas grupos diferentes, com operações mais complexas são usados. No entanto, o protocolo 
é definido para quaisquer grupos onde haja um gerado] facilitando sua exposição e estudo. 

A dificuldade de determinar a dado gº neste grupo é fundamental em Criptografia: dizemos que f(a) = 
gº é uma “função de mão única”, porque é fácil de calcular mas difícil de invertefB|(a definição precisa 
de “difícil” fica fora do escopo deste texto, mas está relacionada com o tempo necessário para efetuar a 
operação). 

A exposição do protocolo Diffie-Hellman e de diferentes usos de grupos em Criptografia é padrão na 
literatura da área. O livro de Douglas Stinson é bastante acessível [stio6]; o de Katz e Lindell traz uma 
discussão mais aprofundada dos fundamentos teóricos [KLos]. 


12Há grupos que não são gerados por um único elemento. 
Mais precisamente, dado y = f(x), é difícil encontrar algum elemento em sua pré-imagem. 
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1.6.2 Cubo de Rubik [ grupo ] 


Grupos são usados no estudo do método para solução do cubo de Rubik, e este é um exemplo importante 
de grupo (e de estrutura algébrica) porque os elementos do grupo são movimentos. 

O cubo de Rubik é um quebra-cabeças tridimensional no formato de cubo que permite rotacionar cada 
uma de suas seis faces nos dois sentidos (horário e anti-horário). Desta forma, o cubo tem cada face dividida 
em nove pequenos quadrados, e cada face tem inicialmente uma cor diferente das outras. 


Ao rotacionar as faces, elas ficam em configurações diferentes. Em cada configuração as faces podem apre- 
sentar suas partições (os pequenos quadrados) com diversas cores diferentes. 

O objetivo do jogador é levar o cubo da configuração em que estiver para a configuração inicial, com 
cada face tendo uma única cor. 

O grupo usado no estudo do cubo de Rubik tem como elementos o conjunto de todas as possíveis mo- 
dificações na configuração do cubo (ou seja, todas as sequências de rotações das faces) mais o movimento 
nulo, e a operação do grupo é a concatenação (aplicação em sequência). As rotações são descritas usando 
a seguinte notação: 


* F éa face da frente (“Front”); 

* Béaface detrás (“Back”); 

* U éa face de cima (“Up”); 

* D é a dace de baixo (“Down”); 
* Léa face da esquerda (“Left”); 
* R éa face da direita (“Right”). 


A figura a seguir mostra as faces F, T e R. 
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Denotamos a rotação no sentido horário pelo nome da face: “F” é a rotação da face frontal 90º no sentido 
horário. 

A rotação no sentido anti-horário é denotada pelo nome da face com a marca de um apóstrofo: F’ é a 
rotação da face frontal 90º no sentido anti-horário. 

Duas rotações iguais em seguida formam uma rotação de 180º, que é denotada pelo nome da face com 
uma indicação: F? é o mesmo que F seguida de F. 

Os elementos do grupo são as rotações básicas, já mencionadas (F, B, U, ..., F',..., FZ, ...) € suas 
composições em sequência, FUB, F2DU, etc. Note que FFF = FF=F. 

O movimento nulo é denotado por E (“Empty”). 

Verificamos que o conjunto e operação dados é realmente um grupo: 


* A operação de grupo (duas rotações) resulta em outro elemento do grupo. 
* A operação é associativa. 
* O movimento nulo é o elemento neutro. 


* Para cada rotação existe outra no sentido contrário, e se as realizarmos em sequência não alteramos 
a configuração do cubo (e isso portanto é equivalente ao movimento nulo). 


A operação do grupo não é comutativa - basta observar que de maneira geral, FR leva a uma configu- 
ração diferente de RF. 

Um dos fatos básicos sobre grupos que podemos usar ao raciocinar sobre o cubo é o primeiro teorema 
que provamos: todo elemento em um grupo tem um único inverso - e portanto toda sequencia de movi- 
mentos, da maneira como as definimos, tem uma única sequência inversa. 

O grupo descrito nesta Seção pode ser usado para derivar um método para solução do cubo de Rubik 
(onde “solução” significa levar o cubo de qualquer configuração para a inicial) - o leitor poderá consultar, 
por exemplo os livros “Notes on Rubik's 'Magic Cube”, de David Singmaster e “Adventures in Group 
Theory: Rubik's Cube, Merlin's Machine, and Other Mathematical Toys”, de David Joyner [oyo8]. 


1.6.3 Criptanálise moderna [ corpo; sistemas lineares em corpos | 


Uma cifra é uma ferramenta criptográfica usada para garantir sigilo em comunicações: uma mensagem 
qualquer, representada como uma sequência de bits (e portanto um elemento de Z}), é “misturada” a 
uma chave secreta (que é outra sequência de bits), de forma que um intruso não possa identificar mais a 
mensagem (e nem possa, é claro, obter a chave secreta). Quando a mensagem chegar ao destinatário, a 
chave secreta é novamente usada para decodificar a mensagem. 


chave 


texto cifra texto 
— NO ES, 
claro (encriptação) encriptado 
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A Criptandlise trata de verificar se uma ferramenta criptográfica é segura: tenta-se “quebrar” métodos crip- 
tográficos a fim de realizar algo semelhante a um controle de qualidade. 

O método da criptanálise algébrica consiste em representar um criptossistema como um sistema de equa- 
ções. A solução deste sistema poderá ser uma chave ou mensagem secreta (e portanto resolver o sistema 
deveria ser difícil). 

Desenvolveremos um exemplo muito simplificado de cifra e mostraremos como ele pode ser quebrado. 

Suponha que a entrada seja uma sequência de quatro bits, b = b3b2b1 bo, e uma chave, que é uma 
sequência de quatro bits, k = kskzk1ko. A saída é uma sequência de quatro bits, c = c3czcico, e a cifra 
opera da seguinte maneira: 


kı O bo O b3k2 = c3 
k2 ® bı b2k3 = C2 
k3 b2 by ko = C] 
ko © b3 & boki = co 
Se conhecermos um par de texto claro e encriptado, podemos simplesmente substituir os b; e c;, obtendo 


um sistema linear. Suponha, por exemplo, que b = 1001 e c = 1010. Então o sistema linear a resolver em 
Zo é 


kolelk=0 
k2 $090k; =1 
k3 ® 0 0ko =0 
kelelk =1 


Facilmente determinamos que a chave usada foi 
k = kskzkiko = 0100, 


como é fácil verificar subtituindo k e b e obtendo o texto cifrado c. 
O sistema descrito é fácil de quebrar por vários motivos, mas o mais evidente é que ele se resume a um 
sistema linear. Suponha que a cifra fosse, ao invés disso, determinada por 


kk O bo ® bakokikz = c3 
kzks ® bı & bz2kıkz2k3 = c2 
ksko ® bz & bikokj — =c1 
koki ® b3 O Dbokskz =co 


Ainda que conheçamos um par de texto claro e o texto cifrado obtido dele, não é tão simples determinar a 
chave: supondo que b = 1100 e c = 1010, o sistema que teríamos que resolver é 


kık2 0 Akokik> =1 
koks 0 Takoks =0 
ksko 1 Okok; =1 
koky 1 Okskz =0 


que não é linear, e envolve equações de grau três. Assim, a não-linearidade é uma essencial para a segurança 
de uma cifra criptográfica. 

Algoritmos criptográficos são projetados como sequencias de operações em estruturas algébricas, de 
forma que seja fácil executá-las e que seja difícil invertê-las sem a chave. 

Alguns exemplos de critpossistemas quebrados usando criptanálise algébrica são o AS/5, usado no pa- 
drão GSM de telefonia móvel, e o Keelog, usado em dispositivos digitais em chaves de automóveis. 
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O livro de Douglas Stinson [Sti06] traz uma breve introdução à Criptanálise, embora não aborde a Crip- 
tanálise Algébrica, que tem como pré-requisito um curso básico de Álgebra Abstrata. Sobre Criptanálise 
Algébrica há o livro de Gregory Bard [Bar09] e o de Andreas Klein [Kle13] (estes dois últimos requerem 


considerável capacidade de abstração e preparo em Álgebra, Combinatória e Estatística). 


1.6.4 Códigos corretores de erros [ espaço vetorial; subespaço ] 


Quando uma mensagem eletrônica é transmitida na forma de sequência de bits, é possível que a transmissão 
inclua erros na mensagem - alguns dos bits podem vir trocados, porque os canais de transmissão não são 
perfeitos. Para detectar e automaticamente corrigir estes erros as mensagens podem ser codificadas de 
uma forma especial, usando um código corretor de erros. 

Ao usar um código corretor de erros, enviamos mais informação do que apenas a mensagem, para que 
seja possível detectar quando um erro ocorre. É fácil perceber que informação adicional permite detectar 
e corrigir erros: se enviarmos cada mensagem cinco vezes, e em uma das vezes ela for transmitida com 
erro, o receptor decidirá que as quatro mensagens iguais devem ser aquela correta, e a quinta, diferente, 
deve ter sido transmitida com erro. O envio de múltiplas cópias, no entanto, não é eficiente: na verdade é 
possível corrigir erros usando menos redundância. 

Em códigos corretores de erros é necessário medir quão diferentes duas palavras são. Para isso é usada 
a distância de Hamming] 


Definição 1.76 (Distância de Hamming). A distância de Hamming entre duas sequências de bits (ou seja, en- 
tre dois vetores de Z}) é a quantidade de posições em que eles diferem. Denotamos a distância de Hamming 
entre aeb por d(a, b). + 


Exemplo 1.77. Exemplificamos com a distância entre alguns vetores. 


d(01011,01000) = 2 
d(0101,0101) = 0 
d(0001,1010) = 3. < 


Supomos aqui que as mensagens a serem enviadas são divididas em blocos de k bits. 

O emissor codifica as mensagens de k bits em palavras maiores, com n > k bits. Os bits adicionais serão 
usados para permitir a detecção e correção de erros. Por exemplo, suponha que k = 2 e n = 5. O emissor 
então transforma as mensagens originais de 2 bits em outras mensagens com 5 bits: 


00 — 00000 
01 — 01011 
10 = 10110 
11 > 11101 


Este é um código que permite representar 4 palavras diferentes usando 5 bits, por isso é chamado de [5, 4]- 
código. Está claro que o emissor não usará todas as possíveis sequências de 5 bits. 

A palavra enviada do emissor ao receptor é sempre uma daquelas quatro palavras de cinco bits. A 
mensagem codificada tem mais bits para adicionar redundância. O código que demos de exemplo transforma 


14Trataremos em mais detalhes da definição de distância no Capítulo[7] 
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mensagens de dois bits em mensagens codificadas de cinco bits: 


codificação 


(mi, m2) (c1, €2, C3, C4, C5). 


Observamos que, como há somente 2? palavras de dois bits, que estamos descrevendo com cinco bits, não 
temos como usar todas as palavras de Z3 - as palavras codificadas formam um subespaço de Z3: o zero 
está contido no conjunto; a multiplicação (^) por O ou por 1 resulta em palavra também no conjunto; e 
finalmente, a soma também resulta em palavra deste conjunto: 


01011 € 10110 = 11101 
010116 11101 = 10110 
101106 11101 = 01001 


Após uma mensagem ser enviada, o receptor terá cinco bits. Se os bits corresponderem a uma das quatro 
palavras do código, ele decidirá que não houve erro e aceitará a mensagem. Se os bits não formarem uma 
palavra do código (ou seja se os bits pertencerem a Z3 mas não ao subespaço do código), ele decidirá que 
houve um erro. 

Quando o receptor detecta um erro, ele automaticamente troca a mensagem recebida por uma do có- 
digo - aquela que for mais próxima (usando a distância de Hamming) da que foi recebida. 

Um subespaço de Z} pode então ser visto como um código corretor de erros. O fato de códigos deste 
tipo serem descritos como subespaços de Z} não é coicidência: para que os algoritmos usados para detectar 
e corrigir erros funcionem como projetados, o código deve necessariamente ser subespaço de Z}, e não 
apenas subconjunto. 

Discutiremos mais sobre códigos corretores de erros na seção [4.8.4] 

O livro de Hefez e Villela é um texto introdutório aos códigos corretores de erros. 


Exercícios 
Ex. 1 — Mostre que ((0,1),6) é um grupo. 


Ex. 2 — Na Seção [1.6.1]apresentamos uma estrutura e dissemos que é um grupo. Verifique que de fato 
se trata de um grupo (isso inclui, além de demonstrar que as propriedades valem, mostrar também que a 
operação de grupo sempre resulta em outro elemento do grupo - e que nunca resultará em zero, que não 
pertence ao grupo). Também dissemos que usando aquela operação do grupo, (9º)? = gº», Mostre que 
isso é verdade. 


Ex. 3 — Prove que em qualquer grupo, o elemento neutro é único. 


Ex. 4 — No exemplo exibimos o corpo Q[v'2], formado pelos números da forma a + bv2. Pode-se 
obter infinitos corpos como este, trocando v2 por outros números. Que números são estes? Demonstre o 
que foi afirmado neste exercício (que realmente se pode obter infinitos corpos desta forma). 


Ex. 5 — O produto de Hadamard de duas matrizes A e B é a matriz C tal que ci; = ai;bi;. Dados m e n, seja 
M o conjunto de matrizes m x n com coeficientes reais. Determine se (M, +, O) é um corpo, onde O é o 
produto de Hadamard. 
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Ex. 6 — Prove que o conjunto de todas as sequências de Fibonacci é um espaço vetorial (há infinitas pos- 
síveis sequências de Fibonacci, cada uma começando com diferentes valores para f1 e f2). 


Ex. 7 — Além da operação lógicas e (denotada por ^) definida no texto, em Lógica definimos a operação 
ou, denotada por V, de forma que a V b = 1 se e somente se pelo menos um dentre a e b for 1. Determine 
se ({0, 1}, V, ^) é um corpo. 


Ex. 8 — Seja X = ( ni } onde p e q são polinômios com q(x) £ 0. X é o conjunto de todas as funções 


racionais. Determine se X é um corpo com as operações usuais de soma e multiplicação para polinômios. 


Ex. 9 — No exemplo definimos as operações “E” lógico (^) e “Ou-exclusivo” ($). Verifique que estas 
duas operações são na verdade o mesmo que multiplicar e tomar o resto da divisão por 2; somar e tomar o 
resto da divisão por 2. 


Ex. 10 — Resolva o sistema em Z2: 
Ixolyolz=1 
0x lyodz=1 
Ixodyolz=0. 


Ex. 11 — Mostre um sistema linear em Z3 que não tenha solução. 


Ex. 12 — Diga se são espaços vetoriais. Quando não especificadas, as operações são a soma e multiplicação 
usuais; o corpo usado nos espaços vetoriais é sempre R. 


i) O conjunto das funções constantes de R em R. 
ii){(a,b) € R?: a<b) 
iii) O conjunto das matrizes diagonais. 
iv) O conjunto das matrizes triangulares superiores. 
v) O conjunto dos números complexos com coeficientes racionais (a + bi, a,b € Q). 


vi) O conjunto de todas as distribuições de probabilidade sobre um conjunto finito e enumerável. A ope- 
ração de soma de vetores p = (P1;P2,.--, Pn) €q = (q1, q2,- .-, qn) é a distribuição onde cada 
evento i tem probabilidade (pi + q;)/2: 


co (Pitaq) (P2+q2) (Pn + qn) 
p+a= ( 2 ) 2 Jeee) 2 ) 


O corpo é R. O vetor p multiplicado pelo escalar c é 
1 
HS no Pi 
1 
aona [Me 
k = sen (5) 
cp = (kpı +01 —k)u, kp2 + (1 — k)u, ..., kpn + (1 -— ku). 


vii) O conjunto de todas as funções f : R — R com período 7. 
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viii) O conjunto de pontos com coordenadas pares em R?. 
ix) O conjunto dos pontos com pelo menos uma coordenada prima em R?. 
x) O conjunto de todas as funções reais com derivada positiva em todo o domínio. 


xi) Dada uma partição dos reais em intervalos, o conjunto de funções que tem derivada com o mesmo 
sinal em cada um dos intervalos. 


xii) Os vetores em R” que, quando lidos, são palíndromos (ou seja, todos os vetores da forma] 
(x1, X2, X3, 03 X[n/2]> "+3 X3; X2; X1 ). 
xiii) O conjunto de funções F = { f(x) = acosx+bsenx: a,bEeR) 


Ex. 13 — Demonstre a proposição 


Ex. 14 — Dissemos no exemplo que o conjunto de soluções para qualquer EDO linear homogênea é um 
espaço vetorial. Demonstre este fato. 


Ex. 15 — Mostre que há equações diferenciais não lineares cujas soluções também formam um espaço 
vetorial, 


Ex. 16 — Mostre que para a EDO y” +y’ = 0, as funções da forma g(x) = ae* — be*,com a + b = 0, são 
um subespaço do conjunto de soluções. 


Ex. 17 — Prove que em qualquer espaço vetorial o elemento neutro para adição é único. 


Ex. 18 — O conjunto de matrizes reais simétricas quadradas é subespaço do espaço de matrizes reais qua- 
dradas? 


Ex. 19 — Seja A uma matriz m x n. Para quais vetores bo conjunto(x: Ax = b } é subespaço de R”? 


Ex. 20 — Prove que em um espaço vetorial, 


i) Ov =0. 
ii)—lv +v =0. 
iii) c0 = 0. 


iv) Se u + v = u então v = 0. 
v) Dado v, —v é único. 
vi) Se cv = 0 então c = 0 ou v = 0. 


Ex. 21 — Prove que a quantidade de vetores em um espaço vetorial sobre um corpo F é finita se e somente 
se F é finito. 


Ex. 22 — O primeiro quadrante é um subespaço de R?? Ou, de maneira geral, o primeiro ortante é subes- 
paço de R”? 


Ex. 23 — Encontre subespaços não-triviais do espaço vetorial de n bits, definido no exemplo 


15Na fórmula descrevendo o vetor, [n/2] é o menor inteiro maior ou igual a n/2. Por exemplo, [3] = 3 e [4.2] = 5. 
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Ex. 24— O exemplo[1.57]lista alguns subespaços de F(R). Prove que são de fato subespaços. 


Ex. 25 — No exemplo[1.58)não verificamos que a multiplicação de uma solução por escalar resulta em outra 
solução. Verifique. 
Ex. 26 — Considere os dois sistemas lineares com os mesmos coeficientes (a mesma matriz A): 
i Ax=0 
ii) Ax =b 
Se v é solução para (i) e w é solução para (ii), então v +w é soluçào para um dos dois sistemas. Qual deles? 


Explique. 


Ex. 27 — No exemplo|1.58ļ|verificamos que o conjunto de soluções para um sistema homogêneo de equa- 
ções lineares é subespaço de R”. Explique porque isso não vale para sistemas não homogêneos. 


Ex. 28 — Para qualquer conjunto X, denotamos por 2X o conjunto de todos os subconjuntos de X. Por 
exemplo, 
A= { 1 , 2, 3 } 
2^ ={0,{1}{2h{3}, 
{1,2},{1,3},{2,3}, 
{1,2,3} 
Agora considere as seguintes operações que levam um elemento de Z2 (ou seja, O ou 1) e um conjunto em 
um outro conjunto: 
I9SA=A 
09 A=( 


Dado um conjunto X, determine se 2X com a operação & é um espaço vetorial sobre Z2. 


Ex. 29 — Considere o conjunto de todas as matrizes reais diagonais de ordem n, para algum n fixo. Quais 
são as duas operações que poderíamos usar sobre este conjunto para obter um corpo? 


Ex. 30 — Mostre que o conjunto de todas as variáveis aleatórias relacionadas a um mesmo experimento e 
que tenham variância finita formam um espaço vetorial quando usamos a operação usual de soma de variáveis 
aleatórias e a multiplicação de uma variável por número real. 


Ex. 31 — Mostre que as funções constantes de R em R são subespaço de C[—a, b]. 


Ex. 32 — Mostre que um conjunto de pontos (x,y) tais que y = p(x), onde p é um polinômio de grau 
maior ou igual a dois, não é subespaço de RŽ. 


Ex. 33 — Mostramos neste texto que o conjunto grafos de ciclos disjuntos é um espaço vetorial. usando as 
mesmas operações, diga se são espaços vetoriais: 


i) O conjunto de subgrafos de um grafo; 
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ii) O conjunto de subgrafos conexos de um grafo (um grafo é conexo se sempre há caminho entre quais- 
quer dois de seus vértices). 


Ex. 34 — Em Mnxn, a função que dá o traço (somatório da diagonal) de uma matriz é Tr : Mnxn > R. 
Mostre que o conjunto das matrizes n x n com traço zero é um subespaço de Mn xn- 


Ex. 35 — Identifique o complemento do subespaço mencionado no exercício[34] 


Ex. 36 — Sabemos que Mnxn é espaço vetorial, Prove que o conjunto das matrizes simétricas Snxn é 
subespaço de Mn xn, € que o conjunto Sn xn das matrizes antissimétricas é complemento de Sn xn. 


Ex. 37 — O conjunto F(R) de funções reais é soma direta dos conjuntos de funções pares e funções ímpa- 
res? 
Ex. 38 — O conjunto M3x3 das matrizes quadradas de ordem 3 pode é soma direta de: 

i) Matrizes de ordem 3 não-positivas e matrizes de ordem 3 não-negativas? 


ii) Matrizes de ordem 3 singulares e matrizes não-singulares? 


Ex. 39 — Diga quando se trata de soma, soma direta ou nenhum deles. 
i) Sequências reais; sequências constantes; sequências não constantes. 
ii) Sequências estritamente crescentes; sequências não estritamente crescentes. 


iii) Todas as soluções da equação diferencial y” — y = 0; as soluções da forma ke”*; a solução trivial 


mais as soluções da forma je* — ke *,comk,j Æ 0. 
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Capítulo 2 


Dimensão e Bases 


Neste Capítulo, revemos os conceitos de combinação e dependência linear, presumidamente já estudados 
em Geometria Analítica, desta vez de forma mais abstrata, e os usamos para construir os conceitos de base 
de um espaço vetorial e de coordenadas de vetores em diferentes bases. 


2.1 Dependência linear 


Definição 2.1 (Combinação linear). Uma combinação linear de um conjunto finito de vetores v1, V2,..., Vk 
em um espaço vetorial V sobre um corpo F é um vetor da forma 


VI + dava +... + AkVk 
onde os a; são escalares (elementos do corpo F). 4, 


Exemplo 2.2. Em R3, considere os vetores u = (0,2,0)! ev = (0,0, 1)!. Então os seguintes vetores são 
combinações lineares deu e v: 


u+v=(0,2,1) 

u+2v=(0,2,2) 

u/2+v = (0,1,1) 

10u = (0,20, 0) 

Note que não há combinação linear de u e v com o primeiro elemento diferente de zero. < 
Definição 2.3 (Dependência linear). Seja S = tvi, V2, 0...» vk} um conjunto de vetores em um espaço 
vetorial V. Se um dos vetores em S puder ser escrito como combinação linear dos outros, o conjunto S é 
linearmente dependente, ou LD. Caso contrário, é linearmente independente, ou LI. é 


Equivalentemente, um conjunto de vetores v1, . . . Vg é LI se a combinação linear 


QVi+ avo +... + av, = 0 


implica em aı = a2 =... = ap = l. 
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Exemplo 2.4. Temos a seguir conjuntos de vetores em R?, 


A = {(1,1)", (2,2)"} 

B = {(1,1)", (~1,—1)"} 

C= {(1,1)",(1,2)"} 

D = {(1,1)", 1,2)", (~1,1)"} 


O conjunto C é LI. Se tentarmos obter valores a e b tais que a(1, 1)" 


a=b, 
a=2b, 


o que só é possível coma = b = 0. 
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= b(1, 2)", teremos 


A Figura a seguir ilustra geometricamente estes conjuntos de vetores. 


(2,2) 


(1,1) 


A, conjunto LD (=1,21) 
, 


B, conjunto LD 
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(1,2) (1,2) 


(1,1) (=1,1) (1,1) 


C, conjunto LI D, conjunto LD 


O conjunto C tem exatamente dois vetores não colineares. Os outros tem vetores colienares (A, B) ou tem 
mais de dois vetores (D). « 


Exemplo 2.5. Em Rº, os vetores 
(—1/2, —1, 1/2)", 


(—1/2,2,1)", 
a (1/4, 2,0)! 


u 
v 
w 
são LD, porque u = —v + (1/2)w. « 


Exemplo 2.6. No espaço de polinômios R; [x], os vetores (polinômios) x? +2,x — 1 e 3x? + 2x +4 são um 
conjunto L.D., porque o último é combinação linear dos outros dois: 3x2 4+2x+4 = 3(x24+2)+2(x—1). « 


Exemplo 2.7. No espaço das funções de R em R, os vetores (ou seja, as funções) f(x) = 3x, g(x) = cos(x) 
e h(x) = ln(x) são L.I., porque nenhuma delas pode ser escrita como combinação linear das outras: não 
existem a, b e c diferentes de zero tais que 


a(3x) + bcos(x) + cln(x) = 0 (2.1) 
para todo x. Para mostrar este fato, supomos que existam b e ctais que a equação[2.1Jvalha. Então, teríamos 


—c ln(x) — b cos(x 
= ( ) ( ) , (2.2) 
3x 
para todo x, com b e c constantes. Mas o valor de a, que presumimos ser constante, dependeria do valor de 
x, porque o lado direito da equação [2.2Jnão é constante: como contraexemplo basta tomar x = e, x = 1, 


x=7ex=27, por exemplo, e temos 


—cln(1) — bcos(1) 


ba > a —0.1801c, 
a- In(m) — b cos(7) x 0.1061b — 0.1214c, 

37 
dio RC DOS a i = doe: 
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—c ln(e) — bcos(e) 


a= zx 0.1118b — 0.1226c. 
3e 
Este sistema linear só tem a solução trivial com a = b = c = 0, que é portanto a única maneira de 
satisfazer a equação[2.1| « 


Exemplo 2.8. As matrizes A, Be C a seguir formam um conjunto L.I. 


Ae (a 0) 2= (6 RS CI) 


No entanto, À, B, C acima junto com a matriz D abaixo formam um conjunto L.D., porque D = (—1/7)B + 
C,ou seja, 
D= ( 0 E « 
—1 0 


Exemplo 2.9. No espaço das funções contínuas complexas, e'*, e-iX, seno e cosseno são LD, porque as 
duas últimas podem ser escritas como combinações lineares das duas primeiras: 


1. T. 
cos0 = se! + se ror 


T 1 
sin0 = eles + zie 


—i0 
Note que especificamos o espaço das funções contínuas complexas, porque as funções e'* e e-iX são com- 


plexas « 


Exemplo 2.10. No espaço Z3, os vetores 01101 e 11100 são linearmente independentes, porque nenhum 
é múltiplo de outro. Mas se tomarmos também o vetor 10001, obteremos o conjunto 


(01101,11100,10001), 
que é linearmente dependente, porque 
1(01101) & 1(11100) = 01101 & 11100 = 10001. < 
Teorema 2.11. Qualquer conjunto que contenha o vetor zero, 0, é linearmente dependente. 
Demonstração. Seja A = {0, v1, V2, . . .} Então 
0 = 1(0) +0(vi)+O(v2),..., 


e como há uma combinação linear dos vetores com um coeficiente não-nulo resultando em zero, o conjunto 
é linearmente dependente. E 


2.2 Conjuntos geradores e bases 


Um espaço vetorial, mesmo tendo infinitos elementos, pode ser descrito por uma quantidade finita deles. 

Na leitura da definição a seguir deve-se ter em mente que uma combinação linear sempre é de uma 
quantidade finita de vetores, mesmo que estes sejam escolhidos de um conjunto infinito (ou seja, não con- 
sideramos somas infinitas da forma avı + a2v2 + --:). 
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Definição 2.12 (Gerador). Seja V um espaço vetorial e S um subconjunto não vazio de V. O conjunto de 
todas as combinações linearef!|de vetores de S é denotado por [S]. Dizemos que S gera [S]. + 


Exemplo 2.13. Considere X = { (1, 2,0)", (2, 1,0)" }, subconjunto de Rê. Então [X] é o conjunto de todas 
as combinações lineares de (1, 2,0)" e (2, 1,0). Este é exatamente o conjunto de vetores da forma (x, y, 0). 


< 


Exemplo 2.14. O seguinte conjunto, 


(69 Gah 


gera as matrizes diagonais de ordem dois. Por exemplo, seja A = (4 0). Esta matriz é uma combinação 
linear das duas matrizes acima: 
A=a(1 0) — v[0 0). « 
(i o) É — 


Exemplo 2.15. O conjunto de polinômios (1,x?2, x?) gera os polinômios de grau zero, dois e quatro em x: 


ao = ao(1) 
ao + ax? = ao(1) + a1 (x?) 
2 2 


ao + mx? + a2x = ao(1) + as (x?) + az(x?) 


O conjunto (1, x? + x?, x4} também gera os mesmos polinômios: 
j , 


ao = ao(1) 
ao + ax? = ao(1) + aı (x? 4x!) — ay (x?) 


ax = a (x? + xt) — a (xf) 


ao + ax? + 02x! = ao(1) + a1 (x? +xº) + (a2 — a1 )(xf) 


10 conceito de gerador na verdade é semelhante em espaços vetoriais e grupos (geradores de grupos são abordados brevemente na 
seção páginal35), embora os tenhamos apresentado de formas ligeiramente diferentes. Um subconjunto S C A gera o conjunto 
A se podemos descrever A somente com elementos de S, combinados de alguma forma. Em grupos, “combinar” é usar a operação de 
grupo. Em espaços vetoriais, podemos “combinar” os elementos do conjunto S através de combinações lineares. O gerador descreve 
de maneira compacta o conjunto. Por exemplo, o conjunto (2, 3) gera o grupo formado pelos múltiplos de dois e de três, com a 
operação de multiplicação. Para outro exemplo, podemos exibir o conjunto (a, b}, que contém dois elementos, “a” e “b”, e a operação 
de “concatenação”. Os elementos do conjunto são as sequências de símbolos “a”, “b”, “aa”, “bb”, “ab”, “ba”, e todas as sequencias 
que se pode construir com “a” e “b”. 
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Exemplo 2.16. O conjunto (f(x) = e*, g(x) = cos(x), h(x) = 1 gera o conjunto de todas as funções da 
forma 
j(x) = ae* + bcos(x) + c, 


coma,b,ceR. < 


Exemplo 2.17. O conjunto de sequências de bits 
{1000, 0110, 0001} 
gera as sequências de bits da forma abbc: 


0000,1000 
0001,0110 
1001,1111 « 


Teorema 2.18. Se V é um espaço vetorial e S subconjunto não vazio de V, então [S] é subespaço de V 


Demonstração. Sejam S C V, 
Claramente zero pertence a [S]: basta escolher a combinação linear com todos os coeficientes iguais a 
zero e qualquer vetor de S. 


Se u,v € [S], então existem s1,sz,...,Sk € S tais que 
u = as + as... + AnSk 
v= bis; Te bass o gue TT bask. 


A multipicação por escalar resulta em outro elemento de [S]: 
ku = kası + kazsz +... + kansk 
A soma de u com v também: 


u +V = Q1S1 + A2S2 +... + AnSk + b1s1 + bas; +... + Dn Sk 
= (aı + bı)sı + (a2 + b2)s2 +... + (an + bn )Sk- E 


Exemplo 2.19. Considere o espaço vetorial R, e seu subconjunto S formado pelos vetores da forma 
(1,2,1,0)! e (0,1,0,0)". O conjunto gerado por S conterá vetores da forma (x,y, x, 0) |, e este conjunto 
é um espaço vetorial: 


* [S] é fechado para as operações de soma e multiplicação por escalar: 


- (a,b,a, 0)! + (x,y,x,0)! = (a +x,b +y, a +x, 0)", que também pertence a [S]. 
- k(x, y, x, 0)" = (kx, ky, kx, 0)", que pertence a [S]. 


* As operações de soma de vetores e multiplicação por escalar são as mesmas que tínhamos em R4, 
portanto são associativas; a soma de vetores é comutativa; e vale a distributividade. 


* O vetor zero é da forma (x,y,x,0)!,comx = y = 0. 


* Dado um vetor (x,y,x,0)!, temos o vetor (—x, —y, —x,0)", que também pertence a [S]. < 
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Teorema 2.20. Sejam S e U subconjuntos não vazios de um espaço vetorial V. Então 
i) SE [S]. 
ü) [[S]] = [S]. 
iii) S C U implica em [S] C [U]. 
iv) [V] = V. 


Demonstração. (i) Seja x € S. Então 1x = x é combinação linear de um elemento de S (o próprio x). 

(ii) ([S] E [[S]]) segue diretamente de (i). ([[S]] E [S]) Se x € [[S]], é combinação linear de vetores em 
[S]. Mas a combinação linear de vetores de [S] também está em [S]. 

(iv) ([V] E V) Sejax € [V]. Toda combinação linear de vetores de V deve estar em V também, porque é 
obtida usando soma de vetores e multiplicação por escalares, portantox € V. (V C [V]) segue diretamente 


de (i). E 
Do item (iv) deste teorema concluimos que se S é subespaço de V, então [S] = S. 


Teorema 2.21. Seja B um conjunto den vetores L.I. de um espaço vetorial. O maior conjunto L.I. de vetores em [B] 
tem tamanho iguala n. 


Demonstração. Seja Y um conjunto gerado por B = (by,bz,...,bn } (ou seja, X = [B]). Seja 
X =(X1,X2,...,Xk } 


um conjunto L.I. de vetores de V. Todo vetor de Y pode ser escrito como combinação linear de elementos 
de B, portanto temos 
xı = abı + a2b2, +... + anban. 


Como xı Æ O (porque X é LI.), então existe algum a;b; na expressão acima com a; Æ 0, e portanto bi 
pode ser escrito como 
bi = coxı + c1bı + c2b2, +... + cnbn. 


Se removermos b; de B, trocando-o por esta expressão, teremos outro conjunto B’: 


B’ =(by,...,bi 1, [Coxi + cb +c2b2, +... + cnbnl,biya,...,bk + 
={d1b1,..., di—1bi—1, CoX1, di+1bi+1,.-., deb). 


O conjunto B’ também gera X, mas contém o vetor cox; ao invés de b;. 

Suponha agora que k > n. Esta operação (de trocar algum b; por sua expressão como combinação 
de elementos de X) pode ser realizada n vezes, resultando em um conjunto contendo n múltiplos dos x;. 
Temos então que n vetores de X geram Y. Se geram Y, também podem ser usados para expressar os outros 
x; restantes - o que contradiz o fato de X ser L.L a 


Definição 2.22 (Base). Seja V um espaço vetorial e B um subconjunto finito e não-vazio de V. Dizemos 
que B é uma base de V se: 


- BÉL; 


* [B] = V (ou seja, todo vetor de V pode ser escrito como combinação linear de vetores deB,e B é o 
menor conjunto que permite escrever todos os vetores de V). + 
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Exemplo 2.23. Os vetores ey = (1,0,0)",ez = (0,1,0)",e e3 = (0,0,1)! são uma base para o es- 
paço vetorial Rº, já que (i) todos pertencem a R? e (ii) todo vetor (x,y,z)! de R? pode ser escrito como 
combinação linear de e1, e2 e es: 


xe; + yez + zez = x(1,0,0)! + vy(0,1,0)! +z(0,0,1)! = (x,y,2)!. 

Outras bases para R? são 
((1,2,3)",(4,5,0)",(6,0,0) 
1(1,1,2)",(1,2,2)], (22/2) 
[(0,0,7)7,(0,e,0)",(v2,0,0)") « 


Exemplo 2.24. Considere C como um espaço vetorial sobre R - ou seja, o corpo subjacente é o dos reais. 
Queremos gerar todos os complexos, que são da forma 


1} 
a 


a+bi, 


e portanto precisamos de dois números na base. Como só os multiplicaremos por reais, precisamos de um 
real e um complexo: 
Podemos desta forma gerar qualquer complexo como combinação linear de B, com coeficientes reais (porque 
o corpo subjacente é R). 

Se quisermos poder multiplicar por complexos, temos que mudar o corpo subjacente, e usar C. Neste 
caso, só precisamos de um elemento na base: 


B’ ={1 +i}, 


Qualquer complexo pode ser escrito como múltiplo de 1 +i. Suponha que queiramos escrever a + bi como 
múltiplo de 1 + i. Queremos x, y tais que (x + yi)(1 + i) = a + bi. Multiplicando, temos 


(x +yi)(1 +i) = (x-y) + (x+y)i. 


portanto precisamos de xey tais que 


a=x—Uy 
b=x+y; 
ou seja, 
b+a 
UR e 
b~a 
“2 
De fato: considere o complexo 3 — 5i. Temos neste caso a = 3, b = 5. Precisamos usar, portanto, 
ma y9+3 at 
2 
Y na 3 E ds 


e o número que queremos é —1 — 4i. Verificamos: 


(—4— i) (1 +i) =3-—5i. « 
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Definição 2.25 (Base canônica para R™). No espaço R”, denotamos por e; o vetor coluna com todos os 
elementos iguais a zerd?| exceto o i-ésimo elemento, que é igual a um. Ou seja, 

er=(1,0,0,...,0)" 

e2=(0,1,0,...,0)" 

e3=(0,0,1,...,0)" 


en = (0,0, Om, 1)" 
A base canônica para R” é 
ter,e2,...,en). + 

Exemplo 2.26. Para qualquer n inteiro maior que zero, há infinitas bases diferentes para R”. Por exemplo, 
os vetores 

by=(2,1,1,1,...,1)! 

ba=(2,2,1,1,...,1)! 

bs = (2,2,2,1,..,1)! 


bn = (2,2,2,,2.Q29)" 
também formam uma base para R”, já que são n vetores LI, todos pertencentes a R”. « 
Exemplo 2.27. O espaço Rn [x] de polinômios com grau < n tem como base o conjunto 
B ={1,x, x2, x3, ..., X" }. 

Esta não é a única base de Rn [x]. Todo polinômio pode também ser escrito como combinação linear de 

B'=[x,x41,2x2,3%,...,nx"). 
Por exemplo, o vetor (polinômio) 5x? + x — 3 pode ser descrito facilmente usando a base B: 

5x2 +x = 3 = 5(x?) + 1(x) —3(1). 


Para escrever este mesmo polinômio na base B’, verificamos primeiro que precisamos da constante —3, e 


Zu 


como o único elemento da base que nos dá constantes é “x + 1”, damos a ele o coeficiente —3. Temos então 
—3x— 3, 
mas precisamos de x, e não —3x. Adicionamos então quatro vezes o polinômio x, que também está na base: 
4x) -3(x+1) =x—3. 


Somamos agora 5 vezes x? e temos 


5 
5x2 +x 3 = 5(2xº) HF4(x) -3(x +1). « 
20s vetores da base canônica também são chamados de vetores de Kronecker. Em R?, e1, e2, e3 são algumas vezes denotados por i 
je k. 
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Exemplo 2.28. O espaço R[x] de todos os polinômios reais, com qualger grau, não é finitamente gerado 
(não tem base finita). Uma base para este espaço é o conjunto (1,x,x2,x2,...). « 


Exemplo 2.29. O espaço das matrizes quadradas 2 x 2 com coeficientes reais tem como base o conjunto 
formado pelas quatro matrizes no conjunto B a seguir. 


B= (4 3)» (8 3): e (2 9). 


Outras bases para este mesmo espaço são 


(6) CG) (9) 


e 
Bt=4[1 11, (2 yy pe E (22 oa 
11 57 m n v5 v7 
De maneira geral, o espaço das matrizes m x n terá uma base com mn matrizes. « 


Exemplo 2.30. Como vimos no exemplo o espaço vetorial formado pelas soluções da equação dife- 
rencial ordinária y” — y’ = 0 contém as funções da forma 


y=aqe*-—be*, 
Estas funções são claramente combinações lineares de e* com e”*. Assim, a base do espaço é 
B ={f(x) es, g(x) = e), 
e o espaço tem dimensão dois. poderíamos também ter usado a base 
B’ = {f(x) =e” +e7™*, g(x)=et-e*, 
porque este conjunto também é LI e gera o mesmo espaço. « 


Para definirmos dimensão precisamos determinar primeiro que as bases para um espaço vetorial tem 
todas o mesmo tamanho. 


Teorema 2.31. Se um espaço vetorial tem pelo menos uma base com um número finito de elementos, então todas as 
suas bases tem o mesmo tamanho. 


Demonstração. Seja V um espaço vetorial e B uma base de V com n elementos. Como V = [B], então não 
pode haver mais que n vetores L.I. em V, e portanto não há base maior que B. 

Se houvesse base B” menor que B com m < n vetores, então teríamos [B'] = V, e geraríamos V com 
m < n vetores, e B não poderia ser L.I. (portanto não poderia ser base). E 


O conceito de dimensão captura uma idéia simples: se, para expressar um vetor em um espaço, preci- 
samos de n coordenadas, o espaço tem dimensão n (posto de outra forma, a dimensão é a quantidade de 
graus de liberdade que temos se quisermos escolher um vetor). 
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Definição 2.32 (Dimensão). Um espaço vetorial tem dimensão finita se é o espaço trivial ou se tem pelo 
menos uma base com um número finito de elementos] Em outros casos, o espaço tem dimensão infinita. 
Se um espaço V tem dimensão finita, então sua dimensão, denotada dim V, é o número de vetores em 
qualquer base de V. 
O epaço vetorial trivial (0 } tem, por definição, dimensão zero. 4, 


Exemplo 2.33. O espaço R? é gerado por bases com três vetores, portanto tem dimensão 3. De forma mais 
geral, o espaço R” pode ser gerado pela base { e1,...,en } com n vetores, portanto dim(R”) = n. < 


Exemplo 2.34. O espaço Rn [x] dos polinômios com grau < n é gerado pela base 
{ 1,x, X2... X? Ea 
que tem n + 1 vetores, e portanto dim(Rn [x] =n + 1). < 


O próximo exemplo mostra que se mudarmos o corpo subjacente podemos mudar a dimensão de um 
espaço vetorial. 


Exemplo 2.35. O conjunto de polinômios {1,x,x?, x3, . . .} é linearmente independente e suas combina- 
ções lineares são os polinômios com coeficientes reais. Embora este conjunto seja de fato uma base para 
os polinômios em R, não trataremos deste caso, porque o conjunto é infinito. Dizemos que a dimensão do 
espaço de todos os polinômios em R é infinita (dim Rn [x] = 00). < 


Exemplo 2.36. O espaço F de todas as funções f : R — R não é gerado por qualquer base finita, portanto 
tem dimensão infinita. Para verificar, basta observar que cada polinômio determina uma função, e como 
dim Rn [x] = oo, necessariamente dim F = oo, porque uma base para F deve conter uma base para R, [x]. 

< 


Exemplo 2.37. No exemplo[2.24] mostramos que se quisermos tratar C como um espaço vetorial sobre os 
reais - ou seja, somamos complexos mas só os multiplicamos por reais - então o espaço poderia ter como 
base 

B={1,i}, 


e portanto sua dimensão é dois. 
No entanto, se quisermos tratar C como um espaço vetorial sobre C - ou seja, se quisermos poder somar 
e multiplicar complexos entre si, podemos usar como base 


B’ ={1 +i}, 
e passamos a ter um espaço de dimensão um. < 


Exemplo 2.38. Damos como exemplo agora outro espaço de dimensão infinita - o espaço das funções 
racionais, que definimos a seguir. 


Definição 2.39. Uma função racional f(x) é a razão de dois polinômios: 


sendo q(x) diferente do polinômio nulo. + 


SÉ possível generalizar a noção de base, permitindo uma quantidade infinita de elementos, e resultando em espaços vetoriais de 
dimensão infinita. A descrição das bases para alguns destes espaços vetoriais envolve dificuldades conceituais, e ao longo deste texto 
os abordaremos em poucos exemplos. O Capítulo[iáltrata mais extensivamente de alguns espaços de funções com dimensão infinita. 
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O conjunto de todas as funções racionais é um espaço vetorial: 
i) Este conjunto está contido no conjunto de todas as funções reais, que sabemos ser um espaço vetorial; 
ii) A função zero está neste conjunto, com p(x) = 0 e q(x) = 1; 


iii) Tanto a soma de duas funções racionais como a multiplicação de uma função racional por escalar 
resultam em outra função racional. 


Este espaço vetorial tem dimensão infinita. O conjunto 


l 1 1 x 
x - i — : jEN,a,b,c € R,b? < 4c 
i "(xa (x2 +bx+ce}tI? (x%+bx+c)+! ERR AS i } 
que tem infinitos elementos, é LI e constitui uma base para o espaço vetorial das funções racionais reais. 
Não demonstraremos aqui estes dois fatos. « 


Teorema 2.40. Em um espaço V de dimensão n, qualquer conjunto com n vetores L.I. é uma base. 


Demonstração. Para ser uma base precisamos que o conjunto seja L.I. e que gere o espaço vetorial. Como já 
temos um conjunto L.I., basta mostrar que os n vetores geram o espaço. 

Sejam V um espaço vetorial de dimensão n, e X = (x1,X2,...,Xn } um conjunto L.I. de vetores de V. 

Mostraremos agora como escrever qualquer vetor v como combinação linear de elementos de X. 

Se adicionarmos um novo vetor a X teremos um conjunto L.D. (porque teremos mais que n vetores). 
Assim, ao adicionarmos v 0, existem a; e b tais que 


axy+ ax +...tanxn +bv=0 


mas b deve ser diferente de zero porque X é L.I., e se b fosse zero, teríamos a combinação ajx1 +azx2 +... 
+anXn = 0, com algum a; Æ 0. Então, 


Vel a1X1 — 02X2 — ...— An Xn )- | 
O próximo teorema nos garante que podemos, a partir de qualquer conjunto L.I., completar uma base 
para um espaço vetorial - algo que faremos em algumas demonstrações mais adiante. 


Teorema 2.41. Seja U um subconjunto linearmente independente de um espaço V de dimensão finita. Se U não 
gera V, podemos adicionar vetores a U de forma a obter uma base para V. 


Demonstração. Se U não gera V, então existe pelo menos um vetor v € V que não pode ser escrito como 
combinação linear de vetores de U. Adicionamos v a U, obtendo um novo conjunto de vetores L.I. Repeti- 
mos este processo até obter um conjunto que gere V. Tal conjunto será obtido com no máximo n vetores, 
onde n é a dimensão de V, porque de outra forma teríamos n + 1 vetores L.I. em um espaço de dimensão 
n. E 


Exemplo 2.42. O conjunto 
X= {(0, 0, 1 JN (0,2,2)"} 


tem dois vetores LI, mas não gera o espaço R? (este conjunto só pode gerar vetores com a primeira coor- 
denada igual a zero). podemos completar este conjunto com mais um vetor, obtendo uma base: 


x’ = {(0,0, 1)", (0, 2,2)", (3,3,3)"}. <a 
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Os próximos teoremas relacionam as dimensões de subespaços somados com a dimensão da soma deles. 
Teorema 2.43. Seja V um espaço com dimensão finita, tal que V = U ® W. Então 
dim(U $ W) = dim(U) + dim(W). 


Demonstração. Seja n a dimensão de V. Podemos construir uma base para U da seguinte maneira: esco- 
lhemos qualquer vetor uy € U que seja diferente de zero e o incluímos em B. Depois, adicionamos outros 
vetores de U ao conjunto B, desde que ele continue L.I. Como U C V, haverá no máximo n vetores, por- 
tanto B é finito. Como B é o maior subconjunto L.I de U, é base de U. 


Suponha que o número de vetores em B seja k. Sek < n, podemos adicionar mais vetores de W até 
formar uma base para V. Seja B’ o conjunto destes vetores usados para complementar B. Então [B'] = W, 
e [B U B’] = V. Já há k vetores em B, portanto W deve ter n — k vetores, porque uma base para V precisa 
de exatamente n vetores. 


Temos então que 


dim(U) + dim(W) = k + (n — k) = n = dim(V). E 


Proposição 2.44. Todo subespaço U de um espaço V de dimensão finita tem um complemento em V: este com- 
plemento é um outro subespaço W tal que V = USO W. 


Demonstração. A proposição é provada implicitamente na demonstração do teorema E 


Note que “complemento” não necessariamente significa complemento de conjuntos; também não é 
necessário que o complemento seja único, como podemos verificar no exemplo a seguir. 


Exemplo 2.45. Seja A o subespaço de RŽ formado pelos vetores (x, y) com x + y = 0 (ou seja, a reta 
y = —x passando pela origem). 

A dimensão de A é 1, porque A é gerado por (1, —1). 

O subespaço B = { (x,y): x—y = 0) é complemento de A, e R? = A & B. A dimensão de B é 1, 
porque é gerado por (1,1) 

Mas o subespaço C = ( (x,y) : 2x — y = 0 } também é complemento de A, e R? = AG C. A dimensão 
de C é 1, porque é gerado por (1,2). 

Temos portanto 


= dim(R?) 
= dim(R?). 


dim(A) + dim(B) = 
dim(A) + dim(C) = 


Quaisquer duas retas diferentes passando pela origem podem gerar R?, portanto uma reta tem, em R?, 
infinitos complementos. A figura a seguir mostra o subespaço A (a reta y = —x) e dois dos seus infinitos 
complementos: (0) subespaço B (a reta yS x); o outro subespaço C (areta y= 2x); e um outro subespaço, 
D (areta y = x/3). 
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Com os vetores da reta À e os vetores de uma das outras retas diferentes de A, podemos gerar todos os 
vetores em R?, < 


Exemplo 2.46. Sabemos que R4[x] = R2[x] & R3..4[x]. Uma base para R2[x] é 


{1,x,x? | 


e portanto sua dimensão é 3. Uma base para R3..4[x] é 


[exis 
e portanto dim(R3..4[x]) = 2. 


A dimensão de R4 [x] deve portanto ser 5. E realmente uma possível base para Ru [x] é a união das bases 
dos subespaços que acabamos de mostrar: 


(1a, Ps 


Concluímos portanto que dim(Rq [x]) = 5. 
Observamos também que o complemento de Rs [x] é Rs. .4 [x], também subespaço de Ry [x], conforme 


a proposição[2.44] < 


Exemplo 2.47. Seja F o espaço de funções reais, e K o espaço de funções constantes. Seja N o conjunto 
N=(0JUFNK, 


ou seja, N contém todas as funções não constantes e também a função zero. Embora N seja o complemento 
de K na linguagem de conjuntos (N = KS, ou N = K), ele não é complemento do espaço vetorial K. 

Para verificar isto, mostramos que N não pode ser espaço vetorial, porque a soma em N não é fechada. 
De fato, podemos somar duas funções não constantes resultando em uma função constante: seja a função 
constante h(x) = k. Construímos duas funções 


f(x) =x+k 
g(x) = — 


e temos (f + g) = h: a soma de duas funções, uma crescente e uma decrescente, iguais a uma função 
constante. Assim, a soma não é fechada em N, logo N não é espaço vetorial, e por isso não pode ser com- 
plemento de um subespaço. « 
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Teorema 2.48. Seja V um espaço com dimensão finita igual a n, tal que V = U + W. Então 
dim(U + W) = dim(U) + dim(W) — dim(UNW). 


Demonstração. Seja X = UN W. Argumentamos que a base de X, com k vetores, pode ser usada como parte 
das bases de U e W, com l > kem > k vetores. Assim, ao construir bases para U e W, observamos que 
Bx C Bu e Bx C W, e portanto devemos contabilizar os vetores de By e Bw descontando o tamanho de 
Bx, que é subconjunto de ambos. 


E 


Ko 7 
base: l vetores, base: m vetores, 


v 


k deles de Bx base: Bx com k deles de Bx 
k vetores 


Mais detalhadamente: sabemos que X é subespaço de V, e podemos construir uma base para X, com 
vetores 
Bx = { X1; X2; -+3 Xk Js 
sendo k a dimensão de X. Como X C U, podemos também completar esta base para obter uma base de U 
com os vetores 
Bu = { X1,- -k Uk41,-.-,UL), 


onde L é a dimensão de U. Também podemos da mesma forma completar a base de X para ober uma base 
de W: 
Bw =(X1,.0 5X Wk41o005Wm ), 


onde m é a dimensão de W. 

Se um vetor a pertence a U + W, pode ser descrito (não necessariamente de maneira única) como a 
soma de um vetor de U e um de W (a = u + w). Mas u e w são combinações lineares de vetores das bases 
de U e W: 


a =x + ax +... + XkXk + Ak+1Uk+1 +... + U (este é u) 
+ Baixa + Box +... + BkXk + BktiWk+1 +... +H Bmwm (este é w) 
= (01 + Bi)xy + (&2 + B2)x2 +... + (ox + Br)xk 
+ rua +... +ou + BktiWk+l +... + BmWm- 
Este conjunto, 
B ={X1,..., Xk; Uk+1; UG Wk+1; 0 Wm ) 


portanto gera V, e tem l + m — k vetores. Para mostrar que B é uma base de V, falta mostrarmos que B é 
L.I. 
Se B fosse L.D., poderíamos encontrar coeficientes œ, Bi, Yi, não todos zero, tais que 


X1X1 +... H Go Bee EBAY +... +HYmWm = 0. (2.3) 
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Suponha que algum œi Æ 0. Teríamos então 
X1X1 +... + GXi +... + XkXk = 0, 


o que não é possível, já que estes vetores são base de X (e portanto L.I.) Como os «; são zero, temos que 
supor em seguida que algum RB; é diferente de zero. Mas então teríamos 


x +... + AkXk + Bete +. a + Biti +... + Biu £0; 
o que também não é possível, porque 
{X1;.. -Xk Uk +f +, UI) 


é base para U, e portanto é L.I. 

Repetimos o raciocínio para os y;, e concluímos que para que a expressão valha, todos os coefici- 
entes devem ser zero, e o conjunto B é L.I. 

Provamos que B é base para U + W, e tem l + m — k vetores. Assim, 


dim(U + W) = dim(U) + dim(W) — dim(U N W). E 


Observe que na demonstração de Teoremal2.48| começamos construindo uma base Bx para a interseção 
U N W justamente para poder construir as outras duas bases By e Bw tendo Bx como interseção. 


Exemplo 2.49. Sejam A = [(0,w,x,y,Z): w,x,yY,z E R}eB = {(a,0,b,c,0): a,b,c € R }subes- 
paços de R”. O espaço A contém todos os vetores onde a primeira coordenada é zero; o espaço B tem os 
vetores onde a segunda e a quinta coordenada são zero. Temos claramente que 


A+B=Rº. 
Agora calculamos as dimensões destes espaços. Uma base para A poderia ser 
Ba = ((0,1,0,0,0)",(0,0,1,0,0)",(0,0,0,1,0)",(0,0,0,0,1)! } 
= { e€2,€3, €4,65 } 
e portanto dim(A) = 4. Uma base para B tem três vetores: 
Bg =[e1,e3,e4), 


e dim(B) = 3. 

A soma das dimensões de A e B é sete - diferente da dimensão de Rº. Calculamos então a dimensão de 
ANB. 

Como A N B contém vetores que estão em A e também em B, então 


ANB = { (0,0,d,e,0)": deeR] 
contém vetores com as coordenadas 1, 2 e 5 iguais a zero. Este espaço pode ser gerado pela base 
BAB = {e3,€4 h 
e tem portanto dimensão 2. 
Verificamos então que 
dim(A +B) = dim(A) + dim(B) — dim(A N B) 
5=4+3-—2. < 
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2.3 Isomorfismo e coordenadas 


Nesta seção mostramos que os espaços que estudamos são aparentemente diferentes, mas na verdade são 
tão semelhantes aos espaços da família R” que é possível restringir nossa discussão somente a estes últi- 
mos. 


Definição 2.50 (Isomorfismo). Sejam V e U dois espaços vetoriais. Um isomorfismo entre V e U é uma 
bijeção f : V — U tal que, para todos vetores v, w € V e todo escalar c, 


e f(v +w) = f(v) + f(w) 
e f(cv) = cf(v). 
Neste caso dizemos que V e U são isomorfos. 4 


Exemplo 2.51. O espaço R2[x] é isomorfo a Rº. 


Seja f a bijeção que associa polinômios ao + ajx + ax? 


ao vetor (ao, 01,42)! em R? - ou seja, 


f(ao + ax +a2x?) = (ao, a1, a2)". 


2 


Mostramos agora que f é um isomorfismo. Sejam u = Uo + Uu1x +Uu2x^ e v = vo +v1ıx + vox2. Primeiro, 


verificamos a soma: 
f(u+v)= f (uo + ux + Ux? + vo +vix+ vox?) 
=f (uo + vo + (u1 +vi)x + (uz + v2)x?) 
= (uo + vo, u1 + Vi, U2 +V2) 
= (uo, u1, U2) + (vo, v1, v2) 
= f(u) + f(v). 


Agora a multiplicação por escalar: 


f(cv) = f (c(vo + vix + v2x2)) 
= CVo + CVIX + cvzx? 
= (cvo,Cvi,Cv2) 
= c(vo,vi v2) 
= cf(vo + vix + v2x?) 
= cf(v). 

Assim, f é isomorfismo, e o espaço dos polinômios de grau máximo 2 é isomorfo a R3. 

De forma mais geral, o espaço de polinômios Rn [x] é isomorfo a R”+!, « 


Exemplo 2.52. Considere M2,2, o espaço das matrizes 2 x 2. Definimos a seguinte bijeção entre M2,2 e 


R$: 
rI(s ] = (a,b,c, d)". 
c d 


Esta bijeção é um isomorfismo: sejam duas matrizes 


mepeg 
c d y z 
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Então 
f(A+x)=f| (a b)+(w eo b+ )| 
[(s J k Z c+y d+ 
=(a+w,b+x,c+y,d+z)" = (a,b,c, d)" + (w, x,y,z) 
=+|(¢ »)| +i | = f(A) + f(X), 
c d y z 
e 
esel (e 8) 
c d ke kd 
= (ka, kb, kc, kd)!" = k(a, b, c, d)! 
= (a oy = kf(A). 
c d 
O espaço vetorial Mm,n será sempre isomorfo a RT”, « 


Exemplo 2.53. Sabemos que o espaço vetorial das soluções da EDO y” — y = 0 contém funções da forma 
f(x) = ae* — be *. 
Podemos identificar cada uma destas soluções com um vetor em R? através da bijeção 
g(ae* — be™*) = (a, b)". 


Verificamos agora que esta bijeção preserva linearidade. 
Começamos com a multiplicação por escalar: dado k € R e uma solução ae* — be™*, 


g [k(ae* — be *)] = g(kae* — kbe*) 
= (ka, kb)! 
= k(a,b)" 
= kg(ae* — be *). 


Agora verificamos a soma: dadas duas soluções ae* — be * e xe” — Be *, 


g [(ae* — be) + (xe* — Be 9] =g [(a+ a)e* — (b + B)e*] 
(a+ a,b +B)" 
a,b)! + (o, B)" 


= ( „b 
= g(ae* — be + g(œe* — Be *). 


concluímos portanto que g é isomorfismo. « 


Exemplo 2.54. Considere o sistema 
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que também pode ser escrito na forma Ax = 0, com 


kT 1 0 =) 
0 0 1/2 —1 


As soluções para este sistema são da forma (w, x, y, z)", com 


WwW 
x=z—— 
2 , 
y =2z 
ou seja, uma solução s é 
W 
s= h£— 2 
2z 
z 


formando um espaço vetoriafi/Temos o seguinte isomorfismo com R?: 


g(w, X,Y, j" = (w,z)", 
já que tanto x como y dependem de w ez. 
A demonstração de que g é isomorfismo é pedida no Exercício[54] < 


Os exemplos anteriores mostram que diversos espaços vetoriais de dimensão finita são isomorfos a R”. 
De fato, todo espaço vetorial de dimensão finita n é isomorfo a R". 

Definimos a base de um espaço vetorial como um conjunto de vetores, mas em um conjunto não há ordem 
dfinida para os elementos. Para poder desenvolver o conceito de coordenadas precisaremos identificar a 
posição de cada elemento na base, por isso definimos base ordenada a seguir. 


Definição 2.55 (Base ordenada). Seja B = (by,b>,...,bn } uma base para um espaço vetorial V de di- 
mensão finita. Então a tupla 


B = (b1,b2,..., bn). 
é uma base ordenada para V. + 


Sabemos que é possível descrever qualquer elemento do espaço como combinação linear dos elementos 
da base, 
v = {a1b; +: + anbn.} 


Como os vetores de uma base ordenada tem posição definida, podemos simplesmente listar os coeficientes 
a1,- ., An para descrever o vetor. Estas são suas coordenadas naquela base. 

A definição a seguir mostra que todos os espaços de dimensão finita (sejam eles de polinômios, ma- 
trizes, funções, ou quaisquer outros objetos) podem ser tratados da mesma forma: ao invés de trabalhar 
diretamente com esses objetos, trabalhamos com coordenadas. 


10 espaço formado por estas soluções tem dimensão dois (há duas variáveis a escolher), com base 


0 1 
1 —1/2 
B= 
2|? 0 
1 0 


Informalmente, o primeiro vetor nos diz se damos um valor a z, devemos somá-lo também a x, e seu dobro a y. De acordo com o 
segundo vetor, quando damos um valor a w, devemos subtrair metade dele de x. Observe novamente a fora geral da solução e veja 
que é exatamente desta forma que x e y podem ser descritas como dependentes de w e z. 
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Definição 2.56 (Coordenadas em uma base). Seja V um espaço vetorial com base ordenada B. Então um 


vetor qualquer de V pode ser escrito como v = ayby + a2b2 +... + anbn. Os coeficientes a1, a2,..., an 
são as coordenadas de v na base B. Denotamos [v]g = (a1, a2, ..., an)", onde a ordem dos coeficientes é a 
mesma dos vetores b; na base B. + 


Exemplo 2.57. Seja B = (1, x, x7, x?) uma base para Rs [x]. Então 
p(x) =x? =x +2 =2(1) — 1(x) + 1(x7) +06), 

e as coordenadas de p(x) nesta base são 

[p(x)]s = (2, —1, 1,0)". 
Se escolhermos uma base diferente para R3[x] - por exemplo, 

B'=4{1,1 +x, 1+x+x, 1 +x+x +, 
descrevemos p(x) usando a base B’ como 
p(x) = 31) —2(x +1) +1(x? +x +1) +0(x3 +x? +x+1), 

e portanto as coordenadas de p(x) na base B' são 

Pls = (3, -2,1,0)". « 
Observe que [.]g; é uma bijeção entre polinômios de Rs [x] e vetores de R4 - ou seja, é um isomorfismo. 


A escolha de bases diferentes para um espaço vetorial implica na escolha de isomorfismos diferentes 
com R". 


Proposição 2.58. Seja V um espaço vetorial de dimensão finita, e sejam « e B diferentes bases para V. Os isomor- 
fismos entre V e R” dados por f(x) = [x] « e g(x) = [x]g são diferentes, ou seja, existe x tal que f(x) # g(x). 


Demonstração. Sejam ~ * R bases para um espaço vetorial V. para todo x € V, existem a1,..., an € 
bi,..., bn tais que 


bl = (01,02,...,0n) 
[x] p = (b1,b2,...,bn) 


Suponha, por hipótese, que [x] = [xlp para todo x € V. Então sempre teremos a; = bi. 

Tome o vetor x = «1. Sua representação na base « é (1,0,...,0). Como dissemos que os isomorfismos 
são iguais, sua representação na base B deve também ser (1,0,...,0),e concluímos que ~ = B1. O mesmo 
vale para todos os outros pares œi, Bi nas bases « e 3 - ou seja, as bases devem ser iguais. Como havíamos 
presumido que as bases são diferentes, chegamos a um absurdo, e devemos negar a hipótese que fizemos 
(kla = [klg para todo x € V). E 


Teorema 2.59. Dois espaços vetoriais de dimensão finita U e V são isomorfos se tem a mesma dimensão. 


Demonstração. Sejam U e V espaços vetoriais com dimensão n (finita). A bijeção 


onde B é alguma base de V, mostra que V e R” são isomorfos. 
Como U, pelo mesmo argumento, deve ser isomorfo a R”, U e V são isomorfos. E 
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Exemplo 2.60. Um exemplo particularmente importante é o espaço C, onde os vetores são números com- 
plexos e o corpo subjacente é R. Claramente, uma base para C é 

B={1,i}, 


já que qualquer complexo pode ser escrito como a + bi, onde a,b € R. Como este espaço é sobre o corpo 
dos reais e tem dimensão dois, ele é isomorfo a R?. A bijeção é 


f(a + bi) = (a,b)!. 


Assim, associamos a cada número complexo um ponto em RŽ. Quando interpretamos R? como o conjunto 
dos complexos, o chamamos de “plano complexo”, onde o eixo das abscissas representa a parte real de cada 
número, e o eixo das ordenadas representa a parte imaginária. A figura a seguir mostra a representação do 
número complexo z = 2 + 3i no plano complexo. 


Im 


Como se tata de isomorfismo, a soma de complexos é representada no plano pela soma usual de vetores 
em R?, Também a multiplicação de complexo por escalar é representada no plano como a multiplicação 
de vetor por escalar. 

É comum adotar a noção de norma de vetores em R? para números complexos, de forma que a norma 


de um complexo é 
la+bil= va? + b2. « 


Exemplo 2.61. Tanto Rs [x] como M2x2 tem dimensão 4. Mostramos agora o isomorfismo entre eles. 
Primeiro, f : R3[x] > Rº: 
Usaremos para Rs [x] uma base 
B = (ig): 


e= (lo a)» keh e al bD 


Definimos agora duas bijeções: 


Em M2x2, usaremos a base 


Por exemplo, considere p(x) = x? — 1. 


f(x? — 1) = k? — 1]g =(-1,0,1,0)". 
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Levamos o vetor p(x) de Rs [x] em R4. Agora, podemos usar a bijeção g para levar de R$ em M2x2: 


9 [(-1,0,1,0)7] = [(—1,0,1,0)"] c = G o) ` 


A composição das bijeções f e g também é uma bijeção - e portanto temos um isomorfismo entre Rs [x] e 
M2x2. 
Agora observamos o que acontece se mudarmos a base de um dos espaços vetoriais. Usaremos para 
R3[x] a base B’, diferente de B: 
B’ = (x,x + 1a 1%). 


Como temos uma nova base, temos também uma nova bijeção, 
fP) = Iplole» 
Novamente, usamos o isomorfismo para levar o polinômio x? — 1 em Moo. 
f'(x- NA: = (2,—2,1,0)", 


porque 2(x) + —2(x + 1) + 1(x2 + 1) + 0(x°). Agora usamos g para levar este vetor de R$ em M2x2, 
usando a mesma base de antes (C) para M2x2: 


= Oy — = T] — [2 —2 
a2, -21,07 = [(2,-2,1,0) = (2 2). 


Esta matriz é diferente da que havíamos encontrado antes. 

Para cada base de Rs [x] e cada base de M2 x 2, teremos duas bijeções f e g. Uma mudança nas bases pode resultar 
em bijeções completamente diferentes. 

O mesmo vale, claramente, para quaisquer outros espaços de dimensão finita. « 


Como os espaços finitos de dimensão n são todos isomorfos a R”, podemos desenvolver toda a Álgebra 
Linear para espaços de dimensão finita trabalhando apenas com R”. 


2.4 Mudança de base 


Se tivermos duas bases R e S para um espaço vetorial V, é possível representar cada vetor v € V tanto em 
uma base como em outra. Nesta seção mostramos como obter uma função que, dada [v]r, determina [v]s. 
Na discussão a seguir, como os somatórios são todos de 1 an, indicamos apenas o índice em cada um 


deles(D ,x =) į; Xi). 


Teorema 2.62. Sejam R = (Tj,...,Tn)eS = (s1,...,8n) duas bases ordenadas diferentes para um espaço V, 
esejav € V. Então as coordenadas de v na base S podem ser escritas em função das coordenadas de v na base R. 


Demonstração. Usaremos os seguintes fatos: primeiro, para qualquer v € V, 
V— yy airi = > bjs. 
i j 


Mas r; € V, portanto pode ser escrito usando base S: 


rj = >. QijSi. 
i 
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Escolhemos agora um vetor qualquer v € V. Temos 
v= se ar; 
j 
-Za (Z qual 
j i 
-Z J ai 
j i 


= x pm ajdi | Si- 
i j 


O termo entre parênteses no somatório faz o papel de coeficiente na combinação linear dos s;, resultando 
em v - e portanto deve ser igual a bi: 
b=) aqy. 
j 


Mostramos que cada b;, coeficiente de v na base S, pode ser escrito como função dos aj, coeficientes na 
base R, usando os qij, que descrevem os vetores de R na base S. E 


Exemplo 2.63. Considere as duas bases a seguir para Rs [x]: 


A = (1,x,x7, x’), 
B=(x, x2, x2 — 2x? 3). 


Queremos uma função que leve coordenadas da base A para a base B. Escrevemos cada vetor de A como 
combinação linear dos vetores de B: 


(x? —2) +0(xº — 3), 
(x? —2)+ 0x? — 3), 


(x2 — 2) +1(x? — 3). 


Ouseja,[1]g = (0, —1/2, —1/2, 0)", [ixlg = (1,0,0,0)",[x2]g = (0,—1,0,0)T eb]g = (0, —3/2, —3/2, 1)". 
As coordenadas do polinômio x? — 3 na base A são 


[x? —3a= (—3,0, 1,0)", 


e portanto aı = —3, a2 = 0. a3 = l e a4 = 0. 
As coordenadas deste polinômio na base B são [x? — 3]g = (by, bz, b3, ba)", com 


bı =}_ aqu =-3(0)+0(1) + 1(0) +0(0) = 0 


bz=3 aqu =—3(—1/2) +0(0) + 1(—1) + 0(—3/2) = 1/2 
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b3 =}_ aiqis=—3(-1/2) +0(0) + 1(0) + 0(-3/2) = 3/2 


ba =}_ aqu = —3(0) + 0(0) + 1(0) + 0(1) =0 


E realmente, 


2 3 ZE o 2 
bı (x) +ba(-x) +ba(x — 2) + b4 (x? — 3) = 0(0) i + (x 3 +0(x? — 3) 
Dude. 
D 3x ~ 6 = ha, 3, 
Temos então [x? — 3ļlg = (0,1/2,3/2,0)". Observamos que com os b; e qi; podemos transformar a 
representação de qualquer vetor da base A para a pase B. « 


Uma observação importante pode ser feita neste momento: todo isomorfismo um espaço de dimensão finita 
nele mesmo representa uma mudança de base. Isso porque tal isomorfismo leva vetores de V em V, e preserva a 
linearidade. O que pode mudar após a aplicação do isomorfismo é a base usada para representar os vetores. 


Exemplo 2.64. Sejam duas bases para Rº, 
x= { (1,0,0)", (0, 1,0)", (0,0,1)" e 
B = { (1,0,0)", (0, 1,0)", (0,0, 1/2)" } e 


Os vetores tem os mesmos coeficientes nas duas bases, exceto que na base À o último coeficiente é o dobro 
daquele na base «: 


[0,23]; = [0,2,6)"] 3 
O isomorfismo & : R? — R? tal que 


(x,y, z)" E (x,y, 2z)) 


leva vetores da base « para a base fà. 


(x,y,z)! = x(1,0,0)! + uy(0,1,0)! + 2(0,0,1)! 
(x,y, z)" = x6I(1,0,0)] +yp[(0, 1,0) + zóI(o,0,1)"] 
= %,0,0)" + (0,1, 0)! 42(0,0,2)" 
= (x,0,0)" + (0,00)! + (0,0,2z)" 
= (x,y, 2z)". «4 


2.5 Aplicações 


2.5.1 Análise Dimensional [ base, dependência linear | 


Nesta seção tomamos a Análise Dimensional como exemplo de aplicação, de grande importância em muitas 
Engenharias. 
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Definição 2.65 (dimensão física). Uma dimensão física é uma quantidade física, que pode ser medida em 
diferentes unidades. + 


Exemplo 2.66. A quantidade de tempo entre dois eventos quaisquer é uma dimensão que pode ser medida 
em diferentes unidades: segundos, horas, dias, etc. A distância entre dois objetos também é uma dimensão, 
que pode ser medida em diferentes unidades: metros, pés, ângstrons, etc. 

Ouros exemplos são pressão, carga elétrica, massa, viscosidade. « 


É comum considerar algumas dimensões como fundamentais. Listamos estas dimensões a seguir, cada 
uma com seu símbolo usual: 


e distância (L) 

* tempo (T) 

* massa (M) 

* carga elétrica (Q) 

Denotamos a dimensão uma grandeza física x por [x]. 


Exemplo 2.67. A seguir temos algumas unidades de medida de grandeza física, com suas dimensões. 


[kg] = M 
[À] = [em] = [km] = L 
[s] = [h] = T 4 


Usando dimensões fudamentais, construimos dimensões a partir de outras. Por exemplo, usando dis- 
tância e tempo construímos velocidade e aceleração. Note que o diferencial de uma quantidade física tem 
a mesma dimensão que a própria quantidade. 


v- [5] «fu 


dv d2s s -2 
lal = HE Es = [Š] A 


Exemplo 2.68. A seguir temos mais algumas dimensões compostas. 


volume [m°] =° 
aceleração [m/s?] = L/T? 
força [kgm/s?} = MLT! 
A primeira dimensão física mostrada, volume, envolve somente a dimensão fundamental da distancia. A 
segunda, aceleração, envolve distância e tempo, e a terceira envolve massa, distancia e tempo. « 


Quando combinamos uma dimensão com ela mesma - por exemplo, quando definimos área e volume a 
partir de distancia - estamos realizando uma “operação” com um número e aquela dimensão: 


28L = L’ (área) 
38 L = L’ (volume) 
Cada dimensão pode, portanto, estar associada a um expoente, e podemos representar dimensões compos- 


tas na forma 
L MeT 
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Exemplo 2.69. A tabela a seguir mostra a representação de várias dimensões físicas. 


nome unidade SI dimensão física 
carga elétrica Coulomb C Q 
volume m? M3 
densidade kg/m? ML? 
força (N) Newton N = kgm/s? N] = MLT? 

aceleração m/s? m/s?) = LT! « 

pressão (Pa) Pascal Pa = N/m? N/m?] = [(MLT})/L?] = ML "T—? 
viscosidade Ns/m? Ns/m?] = [MLT] [T]/[L7} = ML IT! 
energia (J) Joule J = (kgm?)/s? [kgm?/s?] = MIT? 
ddgř| Volt V, ou J/C J/C] =ML?T-2Q7! 

capacitância Farad F, ou C/V Q/V] = M7! L-2T? TQ? 


Em uma equação envolvendo grandezas físicas, os dois lados devem ter a mesma dimensão - dizemos 
que a equação deve ser dimensionalmente homogênea. 


Exemplo 2.70. A equação 


T 2 
s = So + vot + zt A 


que descreve o movimento retilíneo uniformemente acelerado, é dimensionalmente homogenea, porque 
a dimensão do lado esquerdo é [s] = L, e do lado direito temos [so] = L, e 


[vot] = [v] [t] 


T (velocidade é distância por tempo) 


= 551? (aceleração é distância por tempo?) 


e portanto 


1 
[s] = fso + vot+ Jar] 


L= [s0] + + [50] 


L = L+ [LT'] [T] + [1/2] LT [T7] 
L=L+L+L < 


Denotamos por 1 a dimensão vazia, que atribuímos a grandezas sem dimensão física. 
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1 
[cos(x)] = 1 
1 (se O é ângulo) 
Exemplo 2.71. A frequência é a quantidade de vezes que algo acontece em um período de tempo, e sua 


dimensão é T”!. Por exemplo, a frequência angular pode ser medida em radianos por segundo; calculamos 
sua dimensão: 


= 1[1/s] (ângulo tem dimensão 1) 
ZIL « 
Tendo estes fatos em mente, surge naturalmente a pergunta: as dimensões físicas não formariam um 


espaço vetorial? A resposta é afirmativa. Observamos na tabela a seguir uma comparação de conceitos. 
Note que aqui usamos o termo “dimensão física” para elementos de um espaço vetorial. 


espaço de dimensões espaço vetorial 
dimensão vetor 


1 0 
A «A 

AT! œa 
AB A+B 


As dimensões físicas das variáveis usadas na descrição de fenômenos fisico$ formam um espaço vetoria[|sobre 
Q: sejam A B e C dimensões. Então valem as seguintes propriedades de espaço vetorial. 


i) associatividade: (AB)C = A(BC),e (AP) = A(P9) 
ii) comutatividade: AB = BA 
iii) distributividade: APA = AP*9 e (AB)P = AP BP 
iv) há neutro aditivo: 1A = A 

v) há inversos: (A7!)A =1 
vi) há neutro multiplicativo: A! = A 


Quando se estabelece uma base para um espaço vetorial de dimensões, dizemos que temos um sistema. 
Por exemplo, se definirmos a base (M, L, T) nos dá o sistema MLT. A capacitância, por exemplo, é definida 
no sistema MLTQ, porque depende de massa, distancia, tempo e carga elétrica. 

As coordenadas de uma dimensão física no sistema são os expoentes de sua representação. 


Exemplo 2.72. As coordenadas da dimensão área são (0, 2,0), porque 
[em?] = [m?] =L? = MºITº. 


Já as coordenadas da dimensão pressão, ML! TŻ são (1, —1, —2). < 


Não apenas fenômenos físicos. É um exercício interessante buscar exemplos sem significado físico. 
TE note que aqui precisamos listar todas as condições para caracterizar o espaço vetorial. 
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As figuras a seguir ilustram o isomorfismo do sistema MLT com Rê (ambas as figuras mostram os 
mesmos pontos, mudando apenas seus rótulos). As coordenadas mostradas nas figuras são 


[m?] L? (0,2,0) 
[Pa] MLIT? (1,—1,—2) 
[m/s?] LT? (0, 1, —2) 
T 
T 
es ae Pee e 
M EE M: >o L 
MIIT Raras leiria tip- gu sda : 
[Pal [m/s] 


É importante observar que os pontos nos gráficos são os vetores do espaço de dimensões - portanto 
cada um é uma dimensão, e não uma unidade! Assim, o mesmo ponto rotulado com [m?] poderia ter sido 
marcado com [cm?], [km?], etc, porque [m?] = [em?] = [km?] = L2. 


Definição 2.73 (dependencia dimensional). Um conjunto de dimensões Ay, Az,..., An é dimensional- 
mente dependente se é linearmente dependente, com coeficientes racionais. Em outras palavres, é dimen- 
sionalmente dependente se existem racionais «1, «2,..., Xn, nem todos zero, tais que 


AV AS... A% 1, + 


Podemos “traduzir” a definição de dependência dimensional para a nomenclatura e notação com que 
nos habituamos para espaços vetoriais: ela diz que um conjunto de dimensões (vetores) dimensionalmente 
dependente (linearmente dependente) - ou sejam se existem racionais «1, . . ., nem todos zero, tais que 


AT AS ART =1, 


ou seja, 


(BA) E (x2 X A2) H- E (an KAn) =0, 


onde H e X são as operações de soma e multiplicação por escalar neste espaço: AHB = AB; e kXA = AK, 


Exemplo 2.74. As dimensões força, distancia, tempo e massa são dimensionalmente dependentes, como 
podemos verificar observando suas descrições no sistema MLT: 


[Im] = L 
[s] = T 
[kg] = M 

] 


A pressão pode ser descrita em termos de massa, tempo e distância. < 
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Exemplo 2.75. As dimensões pressão e área não são dimensionalmente dependentes! 


[m?] = L? 
[Pa] = ML'T? 


Não temos como descrever L2 em termos de ML! T-2, < 


Toda dimensão física no sisetma MLT pode ser descrita na forma MºL?P TS (ou seja, todo vetor pode ser 
descrito por suas coordenadas) - e podemos usar este fato para obter fórmulas para descrever fenômenos. 


Exemplo 2.76. Suponha que uma partícula cai sobre um fluido viscoso. Sua velocidade para baixo é ace- 
lerada pela ação da gravidade, mas depois de um tempo, a aceleração chega a zero. 

Para modelar o movimento da partícula, determinaremos uma fórmula que descreva sua velocidade 
em função do tempo. A velocidade da partícula depende: 


* do diâmetro, d; 
e da viscosidade, yu; 
* da aceleração, g. 


Além disso, a velocidade é proporcional à diferença entre a densidade da partícula, pp e a do fluido, pr. 
Escrevemos, portanto, 


=kd“u"g (pp — pr). (2.4) 


Nesta fórmula, k é uma constante a ser determinada experimentalmente. Os outros fatores são conforme 
descrevemos, mas ainda não sabemos seus expoentes (ou seja, não sabemos as coordenadas da dimensão 
física). Mas conhecemos a dimensão física de v, e podemos usá-la: como [v] é um vetor no espaço de 
dimensões físicas, escrevemos as dimensões da fórmula[2.4] 


lv] = [kd“pºg (pp — p¢)] - 
Esta fórmula mostra o mesmo vetor nos dois lados da igualdade. Suas coordenadas (os expoentes) devem 
portanto ser as mesmas: 
= [lote “(pp E p+)] 
Rs S fora “(pp — ps] 
MT A = [d° o -P 
MºLTAL= (L)º qu o dC ld a nl 
MLT! — mia b+c 3T b Ze, 


Como os expoentes nos dois lados devem ser iguais, podemos determiná-los resolvendo um sistema linear 
com três incógnitas e três equações: 


b +1= 0 
a-b+ c-3= 1 
—b-—2c =—] 
A solução é a =2,b = —1,c = 1, e podemos escrever os expoentes em nossa fórmula 


Y= kd! g! (Pp — Pf), 


76 CAPÍTULO 2. DIMENSÃO E BASES 


ou 


ats 
y- pEr e) À 


Exemplo 2.77. Observamos o escoamento laminar de um fluido por um tubo de raio r e comprimento L. A 
pressão interna no tubo decai com a distância - isto é chamado de perda de carga. O volume q é função do 
raio, da viscosidade do fluido, u, e da perda de carga, Ap/L. 


A 
a="(owr). 


Listamos a seguir as dimensões de cada variável. 


r | raio distância 

q | fluxo volume por tempo NJ! 

u | viscosidade força-tempo por área ML TH] 
Ap perda de carga pressão por distância ML-2T-? 


As coordenadas das dimensões são iguais em ambos os lados da equação: 
A a 
= (P) wo] 
LT! = (MLT?) (ML'T !)® (L)°. 


Chegamos agora ao sistema 


a+b =0 
—2a—b +c =3 
—2a-—b =—1. 
Resolvendo, obtemos a = 1,b = —1,c = 4, portanto a equação é 
A = 

q=+ (WT é 
Apr 
a 


Esta é a equação de Hagen-Poiseuille. A constante de proporcionalidade k, que pode ser obtida por experi- 
mentos, é igual a 71/8. < 


O próximo exemplo mostra que nem sempre obteremos a fórmula exata que procuramos. 


Exemplo 2.78. Suponha que uma gota de água cai de uma nuvem imóvel. Determinaremos uma fórmula 
para sua velocidade. Presumimos, ainda que nos pareça estranho, que a gota é esférica. Seu raio é r, sua 
densidade é p e sua velocidade é v. A viscosidade do ar é u e a aceleração gravitacional é g. 

Se quisermos determinar a velocidade em função das outras variáveis, escrevemos 


v= krºg?peui 


lv] = [re g” p€ n.º] 
LT! LTS MM TEA 
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onde k é uma constante de proporcionalidade. Temos portanto que resolver o sistema 


c+d=0 
a+ b—3c-d=-1, 
— 2b — d=1 


que tem quatro incógnitas mas somente três equações. Isso significa que não chegaremos à equação exata 
da velocidade, mas a uma equação dependendo de um expoente. 

Precisamos escolher uma das quatro variáveis para deixar livre. Escolhemos d, e escrevemos a solução 
como 


a Pd 
k 2 
l+d 
b=——— 
2 
c=-d, 


Substituindo na fórmula, 


ya kr=1+34)/2g=01+d)/2 dyd 


? 1/2 g1/2 uê 
r3d/2 gd/2 pa 


Note que se tivéssemos escolhido outra variável livre ao invés de d, chegaríamos a outra fórmula, dando 
também uma relação válida entre a velocidade da gota e as outras variáveis. < 


O “Teorema TT de Buckingham” (Teoremal2.79) diz basicamente que se o espaço vetorial onde trabalha- 
mos tem dimensão n, em um conjunto com k > n vetores onde há n vetores LI, podemos descrever todos 
em função desses n. 


Teorema 2.79 (TT, de Buckingham). Seja TT um espaço de dimensões físicas, cuja dimensão como espaço vetorial 
én. Se um experimento físico relaciona grandezas x1, x2, + ..,Xn,---, Xk (onde claramente k > n), na forma de 
uma função 

yY = T(xi,x2,...,Xk), 


então a relação pode ser reescrita como 


ess a1,az a 
Y = (Tni Tn42 0 TX X2 e Xn 


sendo o termo q(. . .) não dimensional (ou seja, tem dimensão 1 = MºLºTº),e 


Xn+1 


bia 
X1 . 


T1 = 
coxbim 
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Xn+2 
m2 = b21 b2 
x ... Xn n 
Demonstração. (Parcial) Claramente, se determinarmos a1, a2,..., an de forma que a1x142X2 . . . AnXn 
tenha as mesmas dimensões de y, então necessariamente d(.. .) deve ter dimensão 1. 
A demonstração de que podemos encontrar os 7; na forma dada fica como exercício. H 


Exemplificamos agora o Teorema TT. 


Exemplo 2.80. Se uma esfera de diâmetro d se desloca com velocidade v por um fluido com densidade p 
e viscosidade |, a força contrária ao movimento da esfera é chamada de força de arrasto. Como esta força é 
função da soutras variáveis, temos 


Fx = f(d,v, P, y). 


Sabendo apenas que a relação envolve estas grandezas, poderíamos tentar realizar experimentos, fixando 
dois parametros de cada vez e variando outros dois. Este procedimento, no entanto, é custoso - e desne- 
cessário se realizarmos a análise dimensional do fenômeno. 

A grandeza f(...) tem a mesma dimensão que Fx, e pode ser descrita no sistema MLT com três vetores 
(dimensões físicas) linearmente independentes (ou “dimensionalmente independentes”). Os vetores que 
representam as quatro dimensões [d], [v], [p], [u] são 


o (9.6) (8) 


Escolhemos d, v, p, que são independentes. Sabemos portanto que u pode ser descrito como combinação 
linear de d, v, p. Usando o Teorema TT de Buckingham, chamamos esta combinação linear de 7x, e a força 
de arrasto é descrita como 


onde n tem dimensão [n] = 1: 


O próximo passo é calcular a, be c. 


[Fx] = [dºvPpº] 
MLT? = (LIMT-!)P(ML) 
Chegamos ao sistema 
c=] 
a+b-3c=1 
—b = —2 


Os valores de a, b e c são portanto 
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Precisamos determinar também x, y, z, que usamos na descrição de 7. Novamente, sabendo que a dmien- 
são de mé [n] = 1 = MºIºTº, calculamos 

MºLºTº = [u] [a*vY p7] 

MED TT =IMLT DEL PRIME 


Resolvemos o sistema, 


z+1=0 
x+ty-—-3z—-1=0 
—Uy —1=0 
e obtendo os valores 
A= Y gA]. 


Isto nos dá 7 = u/(dvp), e temos agora 


F= o 5) d?v?p 


Esta é a equação do arrasto, e o que chamamos aqui de P(u/(dvp)) é o coeficiente de arrasto. 


Agora, tendo a equação do arrasto, percebemos que precisamos de um único experimento para deter- 
minar o coeficiente de arrasto. « 


Há muito material escrito sobre análise dimensional. No entanto, não é comum descrever o espaço 
dimensional como fizemos, em termos de espaços vetoriais. Uma boa introdução à Análise Dimensional 
(ainda sem tratar o espeço dimensional como espaço vetorial) é dada no livro de Gibbings [cibi]. 

Esta seção incluiu exemplos envolvendo Mecânica Básica e Mecânica de Fluidos. Para uma introdução à 
Mecânica Geral, o leitor pode consultar o livro de J. Den Hartog [Har61]. O livro de Robert Brodkey 
dá uma boa introdução à Mecânica de Fluidos. 


2.5.2 Fractais | isomorfismo | 


Muitos dos fractais mais conhecidos, em particular o conjunto de Mandelbrot e os conjuntos de Fatou 
e Julia, são definidos no plano complexo. 

Abordaremos o conjunto de Mandelbrot. 

Considere a seguinte sequencia: começamos com um número complexo inicial zo. Os outros números 
da sequência são obtidos elevando o anterior ao quadrado e somando ao número inical zo, ou seja, 


Zo =C 


FA? VE za + Zo (2.5) 


Por exemplo, se começarmos com zo = 2i, a sequência será 


( 
z2 = (—4 + 2i)? + 2i = 12 — 14i 
z3 = (12 — 14i)? + 2i = —52 — 334i 
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Dependendo do número zo escolhido, o limite da sequencia (zn ) quando n — oo pode ser infinito (ou seja, 
a sequencia diverge), ou finito. Damos a seguir exemplos de duas destas situações. 


i) Sezo = 1,a sequencia é 


ii) Sezo = —2, temos 


Zo = —2 

m=(-22-2=2 
2=(22-2=2 
z23=(22-2=2 


Se para um número c = a + bi a sequência não diverge, então zo é parte do conjunto de Maldelbrot. 


A sequência no caso (i) é divergente (seu limite é +00), portanto 1 não pertence ao conjunto de Man- 
delbrot. 


Já a sequência no caso (ii) é limitada (mais ainda, exceto por zo todos os z; são iguais a dois), logo —2 
pertence ao conjunto de Maldelbrot. 


O ponto importante deste exemplo é: como conhecemos um isomorfismo entre C e R?, podemos plotar o 
conjunto de Mandelbrot no plano. 


Para plotar o conjunto de Mandelbrot, escolhemos os pontos (x,y) do plano com —2 < x < 1e —1 < 
y < 1. Para cada um desses pontos, tomamos c = x + yi e computamos vários valores da sequência zn 
descrita na fórmula[2.5] - por exemplo, de zo até z20. Se percebemos que a sequência converge, pintamos 
o ponto de preto. Se não, usamos alguma outra cor para indicar quão rapidamente a sequência diverge. A 
imagem a seguir, que mostra o conjunto de Mandelbrot, foi construída desta forma. 
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Exercícios 


Ex. 40 — O conjunto 


A = {(x,y, z)" : x+2y -3z =0} 


é subespaço de R?? Se for, mostre um complemento dele. 


Ex. 41 — Considere os subespaços de Rº: 
"A = {(v, w, x,y,z) :xryu-zov 
‘B ={(v,w, x,y,z)! : v—2w=x+y +z} 
Responda o seguinte: 
i) Quem são os vetores no subespaço A N B? 
ii) Determine dim A, dim B, dim(A N B). 
iii) Mostre um complemento de A N B. 


iv) R é soma de A com B? Se for, é soma direta? 


Ex. 42 — O conjunto de soluções para Ax = 0 no exemplo é um subespaço de Rº. Determine um 
complemento para ele. 


Ex. 43 — A união do subespaço de funções pares com o subespaço de funções ímpares é subespaço? 


Ex. 44 — Uma base de um espaço vetorial V pode (ou deve sempre) ser subespaço de V? 
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Ex. 45 — Se um subespaço de R” contém vetores da forma (...,0,...)!, tendo a i-ésima coordenada igual 
a zero, é verdade que toda base para este subespaço também terá zero na i-ésima coordeanda? 


Ex. 46 — Sejam A = (1,x,x2,x)),B = (—1,2x2? — x + 1,x? 4x2, C = (m, x = mx +n? — x +n, nx?) 
bases para Rs [x]. Escreva as coordenadas dos polinômios a seguir usando A, B e C como base ou, se não 
for possível, explique o motivo. 1, x, x2, x3, (x + 1)(x — 2), (x2 + 1x)(1 — 2x) 


Ex. 47 — O que significa dois grafos de ciclos disjuntos (exemplo página/20) serem linearmente de- 
pendentes ou linearmente independentes? 


Ex. 48 — Qual é a dimensão do espaço de sequencias reais? E o das sequências reais constantes? Se algum 
deles for finito, apresente uma base. 


Ex. 49 — É possível obter uma base para Mn xn, sem usar nenhum zero nas matrizes da base? 


Ex. 50 — Um grafo finito tem um número finito de ciclos. Quem é a base para o espaço de ciclos de um 
grafo finito (o espaço de ciclos foi definido no exemplo na páginazo)? 


Ex. 51 — Defina o conjunto P, como um conjunto de n de vetores en R”, de forma que o primeiro vetor 
de Pa tem os n primeiros números primos, o segundo vetor tem os n próximos números primos, e assim 
por diante. Pa é base para R”? 


Ex. 52 — Prove que em todo espaço vetorial de dimensão infinita, dado qualquer k € N, podemos encon- 
trar k vetores linearmente independentes. 


Ex. 53 — Prove que são isomorfos os espaços: 
“[Bl,comB =((0,1,1)",(1,1,1)T Je R2. 


‘R? e o conjunto de todos os polinômios com grau par e menor ou igual a oito. 


Ex. 54 — Mostre que a bijeção g dada no exemplo|2.54/é realmente um isomorfismo. 


Ex. 55 — Use as técnicas da seção)2.5.1)para determinar a fórmula da resultante centrípeta em movimento 
circular. Suponha que você só se lembra que as grandezas físicas envolvidas são massa, velocidade angular 
e raio do caminho circular. 


Ex. 56 — Existe um isomorfismo f entre C e o espaço das matrizes antissimétricas de ordem dois com as 
seguintes propriedades: para todos complexos z1 e z2, 

“f(zi) + f(za) = f(zy +22); 

ef(z1) — f(z2) = f(zi — 22); 

ef(z1)f(z2) = f(z1z2); 

ef(z2)7'f(z1) = f(z1/z2), se z2 £ 0. 


Mostre este isomorfismo; 


Ex. 57 — Mostre o isomorfismo entre Z} e o espaço de ciclos disjuntos de um grafo. 


Capítulo 3 


Transformações Lineares 


O objeto de estudo neste Capítulo são as transformações lineares - certas funções que levam elementos de 
um espaço vetorial em outro, de grande importância em todas as áreas das Ciências Exatas. 


Definição 3.1 (Transformação e operador linear). Sejam U e V dois espaços vetoriais sobre um mesmo 
corpo. Uma transformação linear é uma função T : V > U tal que para todo escalar c e todos os vetores 
vw EV, 


e T(v +w) = T(v) + T(w); 
e T(cv) = cT(v). 
Um operador linear é uma transformação linear de um espaço nele mesmo (T : U > U). + 
Exemplo 3.2. A função f(x1, x2) = x1 + x2 é uma transformação linear de R? em R, porque 
i) para dois vetores (x1,x2) e (y1, y2), 
fllxi,x2) + (um, y2)] = f(x +y1,x2 + uz) =x1 +y1 + x2 +uy2 = f(x1,x2) + fly + y2); 
ii) para qualquer constante k e qualquer vetor (x1,x2), 
f(k(x1,x2)) = f(kxy, kx2) = kxy + kx2 = k(x1 + x2) = kf(x1, x2). 
< 


Exemplo 3.3. Em qualquer espaço vetorial podemos definir a função identidade, que denotamos por id 
e que realiza a transformação id(v) = v. Esta função é um operador linear: leva vetores de um espaço 
vetorial nele mesmo, e para quaisquer vetores v e w, 


e id(v +w) = id(v)+ id(w) = v + w; 
e id(cv) = cid(v) = cv. < 


Exemplo 3.4. A função que dá a transposta de uma matriz é uma transformação linear de Mmn em Mnm: 
claramente, c(A!) = (cA)",eA!+B! =(A+B)!. « 
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Exemplo 3.5. No espaço vetorial formado por polinômios de grau menor ou igual a n, a derivada é uma 
transformação linear: (i) d/dx(p(x) + q(x)) = d/dx(p(x)) + d/dx(g(x)), e (ii) k [ d/dx(p(x)) ] = 
d/dx(kp(x)). « 


Exemplo 3.6. A função f(x1,x2) = x? + x2 não é uma transformação linear de R? em R, porque 

fa +y1,x2 +y2) = (x1 +) +x2 +y2 
que não é, de maneira geral, igual a x? + y? + x2 + y2. « 
Exemplo 3.7. Seja T : R > R, com T(x) = x + 4. Esta função não é uma transformação linear, porque 

Tix+y) = (x+y)+4 
# T(x) + T(y) = (x+4) + (y +4) = (x+y) +8, 
e portanto T(x + y) # T(x) + T(y). < 
Exemplo 3.8. Considere a transformação T : R2 — Rê, com T(x, y) = (x +y,y, 1): 
cT(x,y)= c(x+y,y,1) = (cx +cy,cy,c), 

T(cx, cy) = (cx + cy, cy, 1). 

Como cT(x,y) £ T(cx, cy), a transformação não é linear. < 


Exemplo 3.9. Em RŽ, o operador que rotaciona um ponto por um ângulo O ao redor da origem e no sen- 
tido anti-horário é linear. Não damos aqui uma demonstração formal completa, mas a intuição: primeiro, 
suponha que multiplicarmos um vetor w por uma constante c e depois rotacionarmos por um ângulo 0, 
obteremos um novo vetor. Se rotacionarmos primeiro para multiplicarmos depois, o resultado é o mesmo 
- portanto T(cw) = cT(w). 

Sejam u e v dois vetores. A soma u + v resulta em um vetor w, que rotacionado é w’. Se primeiro 
rotacionarmos u e v para depois somarmos, obteremos w’. Assim, T(u + v) = T(u) + T(v). 

Construiremos o operador T que rotaciona pontos desta forma, e ao definí-lo, manteremos a lineari- 
dade. A figura a seguir mostra o efeito do operador quando rotacionamos os vetores e; e ez por um ângulo 
O. 


cos® : 
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Suponha que queiramos rotacionar e1. O novo vetor deverá ser 


p=T(1) = o 
0 sen O 

= 10 = | =sen0 
gea a 


T[(1,0)"] = (cos O, sen 9)" 
T[(0, 1)"] = (~ sen 9, cos 0)". 


E se rotacionarmos ez, teremos 


O operador T deve então obedecer 


Como T é linear, então necessariamente 


T[(x,0)"] = xTI(1,0)!] = (x cos 9, x sen 6)! 
TI(O,y)'] = yT[(0, 1)"] = (—y sen 9, y cos 6)", 


Tits y)" = T[(x,0)"] +T[(0,y)"] 


= (xcos 8, xsen 0)! + (~y sen 9, y cos 0)! 
y 


= (xcos8 — ysen0,xsenO +y cos 6)!. 


no — Deste å 
y xsen®ð + y cos O 
Exemplo 3.10. No exemplo |1.39|mostramos que as variáveis aleatórias reais em um espaço amostral for- 


mam um espaço vetorial sobre R. Também sabemos que R é um espaço vetorial sobre si mesmo. 
A esperança de uma variável aleatória discreta X é definida como 


(X) = 5 xPrtx), 


A transformação T é, portanto 


desde que o somatório convirja. A linearidade é consequência direta desta definição. Verificamos a soma, 


(X+ Y) =) 5 G+yPrlX=sY=y 
x y 
=} x} PrX=xY=y+}) y} Prx=xY=y] 
x y y x 
=} xPr(x) +53 vPr(y) 
x y 


=E(X) + E(Y). 


Verificamos também a multiplicação por escalar: 


(CX) = >. cxPr(x) = cE(X), 


ou seja, a esperança de c vezes a variável aleatória X é igual a c multiplicado pela esperança de X. < 
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Exemplo 3.11. Seja T : Z3 — Z, tal que 
TÍ (a, b,c, d, e) ] = (a @® b, b, 0,0). 
T é uma transformação linear: 
i) 


T[ (abcde) $ (apyde)]=T(ag a,b PB, coy,egBe) 
=(c64«2b&EB,bEB,0,0) 

= (a ®b,b,0,0) S (x B, B,0,0) 
= T(a, b,c, d,e) 8 T(apyõde). 


ii) 
T[k(a, b,c, d, e)] = T(ka, kb, kc, kd, ke) 
= (ka ® kb, kb, 0,0) 
= k(a ® b, b,0,0) 
= kT (a,b,c, d, e). 


Agora considere F : Z3 — Z?, com 
F[ (a,b,c) = (ab,c,1) 


não é linear, porque F(a, b,c) & (~, B, 8)] £ Fl(a, b,c)l $ Fl(a, B, 6)). < 


Nos exemplog3.7][3.8/e[3.11] mostramos transformações que levavam vetores a outros com alguns ele- 
mentos fixos, e que não eram lineares. Há uma maneira muito rápida de determinar que tais transforma- 
ções não são lineares: o Teoremaf3.12Jnos informa que para qualquer transformação linear T, deve sempre 
valer T(0) = 0. Assim, uma transformação que leve a vetores que não podem ser zero não é linear. 


Teorema 3.12. Seja T : U — V uma transformação linear. Então, para todos X1, X2 ...,Xn E€ U e escalares Kı, 
k2, macaco kn; 


i) T(0)=0 
ü) T(kiXxı + kaxz +`: + knxn) = ki T(x1) + koT(xo) +--+ + knT(Xn) 


Demonstração. (i) Como T é transformação linear, cT (0) = T(c0). Mas 


o que implica em c = tou T(0) = 0. Como c representa qualquer escalar, temos necessariamente T (0) = 0. 

(ii) Intuitivamente, a afirmativa é verdadeira porque a soma de vetores é associativa e a multiplicação 
por escalar é distributiva sobre a soma. Formalmente, a demonstração segue facilmente por indução em 
n, usando a associatividade da soma de vetores e o fato de T ser linear. A base de indução é para um único 
termo; 


T(kixı) = kı T(x), 
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que é verdadeira pela definição de transformação linear. 
A hipótese é de que a afirmação vale para m — 1. O passo é: 


T(kizx + k2X2 + +++ kmXm) = Tlkyzx + (k2Xx2 + +++ + kmXm)] (associatividade de +) 
= T(kyx) + T(k2x2 +--+ + kmXm) (T é linear) 
= kı T(x1) + T(k2x2 ++- + kmXm) (T é linear) 


= kı T (x1) + k2T (x2) +---+kmT(Xm). (pela hipótese de indução) 
E concluímos a demonstração. H 


Na seção|2.4jmostramos como obter uma função de mudança de base para espaços vetoriais. Essa função 
é linear, e a demonstração é pedida no exercício[66] 


Teorema 3.13. Sejam Re S duas bases para um espaço vetorial V de dimensão finita. Então a função que realiza a 
mudança de base em cada coeficiente é uma transformação linear. 


Exemplo 3.14. A seguir temos duas bases para Rº. 


(1,0,0)",(0,1,0)", (0,0, 1)7} 
(1/2,0,0)", (0,3,0)",(0,0,1)") 


A transformação que muda da base « para a base fB é 
T|(x,y, z)'] = Qx,y/3, 2, 


Assim, se x = (1,1,1)!, temos 


Verificamos que ambos representam o mesmo vetor, expandindo-os como combinação linear de cada uma 
das bases: 


kla = (1,1,1)" Şe 1(0,0,1)" +1(0,1,0)54+1(1,0,0)" = (1,1,1)" 
klg E (2,1/3,1)" => x =2(1/2,0,0)" +1/3(0,3,0)" +1(1,1,1)" = (KD 
A transformação T é linear: primeiro mostramos que T[kv] = kT (v). 
T(kv) = Tlk(x,y,2)"] 
=T[(kx, ky,kz)'] 
= (2kx,ky/3, kz)" 
= k(2x,y/3, z)" 
= kT[(x,y,z)"]. 


Agora mostramos que T(v +w) = T(v) +T(w). Sejam v = (x,y,z)! ew = (a, b,c)!. 


T(v +w) =T[(x,y,z)" + (a,b,c)"] 


88 CAPÍTULO 3. TRANSFORMAÇÕES LINEARES 


Tlx+ay+b,z+c)!] 

= (2x + 2a, y/3 + b/3,z + c)" 

= (2x,y/3,z)! + (2a, b/3, c)" 

=T[(x,y,z)"] +T[(a,b,c)"]. < 


Da definição de transformação linear, observamos que podemos somar duas transformações T e S, de 
forma que a transformação (T + S), dada por (T + S) (x) = T(x) + S(x) também é linear; e similarmente, 
também podemos multiplicar uma transformação T por um escalar k, obtendo a transformação kT, dada 
por kT (x) = T(kx). 

Além da soma e da multiplicação por escalar, também podemos realizar a composição de transforma- 
ções (que resulta em uma transformação também linear), e em alguns casos, obter a inversa de uma trans- 
formação (e quando a inversa existe, ela é linear). 


Definição 3.15 (Composição de transformações). Sejam S : V >» U eT : U — W duas transformações 
lineares. A composição de T com S é 


(T o S)(y) = T(S((v))). + 
Exemplo 3.16. Sejam S : Rf — R? e T:R? — R?, tais que 
S[(a, b,c, d)'] = (a +b, b +c, c + d)! 
T[(x,y,z)"] = (—x, —y,x +y + 2)". 
Então a composição de Se T é 
(T oS)(a, b,c, d)" =T(S(a,b,c,d)") 


=T(a+b,b+c,c +d)! 
= (—a—b,—b — c,a +2b+2c +d)". 


Note que a composição é (T o S) : R4 > R3. « 


Exemplo 3.17. Sabemos que a transposição de matriz quadrada é um operador linear. Outra transformação 
linear em matrizes quadradas é a multiplicação de uma linha por um escalar. Tomemos então o espaço 
Ms3x3, com as tranformações: 


* transposição, 


dy i2 %13 d11 021 31 
21 a22 A23 | =| Gy a22 a32 |» 
031 032 Q33 d13 A23 033 


* multiplicação da terceira linha por 5, 


Q11 Q12 13 Qai i2 %3 
a21 A22 Q23 | — a21 Q22 Q23 
a31 Q32 433 5a3ı d032 5433 
A composição T o M é 
11 Q12 Q13 d11 Gy 3 d11 Q21 5031 
ToM [a a» a3)=T| an az as3|=|am az 5as|- < 


a31 032 433 5a3ı 5a32 5033 aı3 a32 54033 
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Exemplo 3.18. Em Rs [x], os dois operadores a seguir são lineares: 
* a derivada segunda, 

d2 

dx? 


(ao + ax + a2x? + a3x°) = 2a2 + 603x 


* a troca do primeiro com o último coeficiente, 


T(ao + ax + a2x? + a3x)) = a3 + ax + a2x? + agx>. 


A composição d? /dx? o T é 


2 2 
—S Tao + ax + a2x? +ax)= — (az + ax + a2x? + aox?) 
dx dx 
= 2a2 + 6aox. < 


Exemplo 3.19. Seja T o operador em R? que realiza rotação pelo ângulo 7/2, e S o operador que realiza 
rotação por —7t/4. Nossa intuição diz que a composição das duas deve ser igual à rotação pelo ângulo 71/4. 
Verificamos! então como seria a rotação R por 71/4: 


_ (xcos(7/4) —ysen(n/4)) _ [(x “o , 
R (3) = ( sen(71/4) +y a ~ pi +y)/v2 (ângulo 7/4) 


Agora calculamos a composição de T com S: 


T (=) = — EER an aê (=) (ângulo 7/2) 
y xsen(7/2) + y cos(7/2) x 

(= 

(= 


s (3) - paso m/4) — y sen(— 2 = ( a) 
y xsen ( ` 


(ângulo —7/4) 
-x y) / vZ i 
A composição T o S é 


T/4) +y cos(—7/4) 


exatamente igual à rotação por 7/4. « 


Proposição 3.20. A composição de transformações lineares é também uma transformação linear. 


Membrete: 
n/2 = 90º n/4 = 45º —n/4 = 45º 


sen(m/2) = 1. sen(n/4) = +1/V2 sen(-n/4) =—1/v2 
cos(r/2) = 0 cos(n/4) = +1/V2 cos(-n/4) = +1/v2 
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Teorema 3.21. Sejam 


Q:V5U 
R:EV5U 
S:W>V 
T:W>V 


transformações lineares. Então 


Ro(S+T)=(RoS)+(RoT) 
(Q +R) oS AS + (RoS). 


Definição 3.22 (Inversa de transformação linear). Seja T : V — U uma transformação linear. T é invertível 
se e somente se é bijetora. A inversa de T, denotada T7!, é tal que T-1(T(v)) = v. 4, 


Exemplo 3.23. A transformação T : R? — R? com 
T(x, y)" = (2x, 3y)" 


é invertível, com inversa 
T '(a,b)" = (a/2,b/3)". < 


Exemplo 3.24. Em qualquer espaço vetorial diferente do espaço trivial, fica evidente que a transformação 
T(v) = 0 não tem inversa. < 


Exemplo 3.25. Atransposta de uma matriz quadrada sempre tem inversa (que é ela mesma, já que (A! )! = 
A). Assim, esta é uma transformação invertível. 


A 


Exemplo 3.26. O exemplo|3.39/mostra o operador T(x, y)" = (x,2x)! em R?. Esta transformação não é 
bijetora: 


TI(3,4)1] = (3,6)" = T[(3, 1)", 
portanto não tem inversa. < 


Exemplo 3.27. Em R, [x], a derivada é um operador linear, mas não é invertível: 


d 
—— do T 07X = Q1 
dx 

d 
— bo + 01X = A] 
dx 

d 

— Co + 01X — q7 
dx 


e portanto não temos um único polinômio tal que d/dx p(x) = a1. « 


Teorema 3.28. Seja T : V — U uma transformação linear invertível. Então T7! é também linear. 
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Demonstração. Sejam vı, v2 € V. Como T é invertível, existem w1, w2 € U tais que T(vı) = w1 e T(vz) = 
w2. Verificamos a multiplicação por escalar: 


T! (cw) = T~! (cT(v1)) 


E verificamos também a soma de vetores: 


To! (w +w2) =T=! (T(v1) + T(v2)) 


=T! (T(vı +v2)) (T é linear) 
=V; + V2 
=T ' (w1) + T~! (wo). E 


Exemplo 3.29. A transformação que rotaciona vetores em R? por um ângulo O tem como inversa a rotação 
por —0, que também é linear. < 


Exemplo 3.30. A transformação T : R4 — R3 [x], com 
T[(a, b,c, d)"] = 3ax? + 2bx? + cx — d 


é uma bijeção, e sua inversa é 


Rr 3 2 Lo /Pș9q H 
T (px? + qx +R) = (5, om; s) ; < 


(o) exercício[64]pede a demonstração da proposição a seguir, que determina a inversa de uma composição. 
Proposição 3.31. Se Te S são invertíveis e a composição S o T é definida, então 


(S o Tr! =T! as, 


3.1 O efeito em uma base determina completamente uma transforma- 
ção 


No exemplo[3.9]desenvolvemos uma transformação linear que realiza a rotação de vetores no plano. Ini- 
cialmente, determinamos o efeito que queríamos na base canônica ( e1,ez ), e com isso determinamos 
completamente a transformação. Aquele exemplo ilustra o que o próximo teorema nos garante: uma trans- 
formação linear T : V — U é completamente caracterizada pelo seu efeito em uma base de V. 

Podemos fazer uma analogia com polinômios: se quisermos determinar as retas ax + b que passam por 
um ponto dado, teremos infinitas delas. Se tivermos dois pontos, há somente uma reta passando por eles, e 
sabemos como calcular sua equação. Por exemplo, se tomarmos o ponto (1,0), há infinitas retas passando 
por ele. A seguir mostramos tres delas, 2x — 2, —x + 1, -3x + 3. 
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Se fixarmos um segundo ponto, (0, —2), somente uma das retas passará por eles, e sabemos que é a reta 
2x — 2. 


Da mesma forma, se tivermos dois pontos no plano, haverá infinitas parábolas ax? + bx + c passando por 
eles. Por exemplo, há infinitas parábolas passasndo por (— 2, 0) e (+v2, 0). Na figura a seguir mostramos 
tres delas: x? — 2, —x? + 2, e 2x? — 4. 


Se fixarmos um terceiro ponto, (1/2, —7/2), somente a parábola 2x? — 4 passará por todods eles. 
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Semelhantemente, com n + 1 pontos determinamos completamente um polinômio de grau n. 

O teorema a seguir nos garante exatamente o mesmo, mas para transformações lineares: conhecendo 
uma base v4, . . . , Vne os valores de T(v;) para seus vetores, podemos ter certeza de que há exatamente uma 
transformação T : V > U que mapeie vı > T(v;). 


Teorema 3.32. Sejam U e V espaços vetoriais de dimensão finita; By = (V1, V2, . . . , Vn ) uma base ordenada de 
V; e u1, U2, . . . Un vetores em U. Então existe uma única transformação T : V — U tal que T (vi) = w. 


Demonstração. Um vetor qualquer v € V pode ser descrito como combinação linear dos vetores em Bv: 
v= 3. iVi. 
i 


Com os coeficientes a; usados para descrever v podemos determinar a transformação T. 


T(v)=T pa oo) 
= 2 aiT (vi) (pelo Teorema[3.12) 
= 2 aiuti. (porque T(vi) = ui) 


Temos portanto uma transformação T : V — U com 


T(v)=}_ au, 


onde os a; são as coordenadas de v na base By. 

Com isto já identificamos completamente a transformação T. 

Nos falta, agora, mostrar o que dissemos no enunciado: (i) que de fato T mapeia os v; nos ui; (ii) que T 
é linear; e (iii) que T é única. 

Primeiro verificamos (i), que T(v;) é de fato igual a u;: 


T(vi) = 0u; + O0uz +... + aiui +... + Un, 


e portanto T(v;) = ui. 
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Assim, obtemos uma transformação T de V em U que mapeia corretamente os vetores v; nos vetores 


ui. 
Agora mostramos (ii), que T é linear. Sejam v,w € V tais que 
v= o AjVi 
i 
W = De bivi. 
i 
Então 
T(v+w)=T [Eier J bri) =T (Z + bo) 
i i 
= > (a +bi)ui = 2 aiti + J biui 
i i i 
= pa om) + z vr) = T(v) + T(w). 
i i 
e 


T(kv) =T fZ ewo >T [E eaw 


i 


a F kau; = ko aiu; = kT (v). 
F i 


Finalmente mostramos (iii) - que T é única. Suponha que R : V — U seja linear, e que R também 
mapeie os vetores v; nos vetores u4, ou seja, R(vi) = ui. Seja v € V, com v = 2 QiVi. 


R(v) = >» aiR(vi) = sa aiui —T(v), 


e R deve ser iguala T. E 


Podemos determinar completamente uma transformação se soubermos o efeito da transformação na 
base canônica. 


Exemplo 3.33. Suponha que precisemos definir a transformação de R? em R? tal que 


Observamos B = [e1,e2,e3 }é base de R?. 
Para todo v € Rº, com v = (x,y,z)", temos uma representação de v na base B). Calculamos então 
[(x,y; z)]B. 


T(v) = T(x, y,z) = T(xey + yez + zes) (T é linear) 
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= xT (e1) +yT(ez) + zT(e3) 
= x(4,8)" +y(1,0)! +z(—1,7)! 
= (4x +y — z, 8x + 7z)", 
e com isso determinamos T. < 


Podemos conseguir o mesmo usando uma base diferente da canônica, como mostra o exemplo a seguir. 
Lembramos que qualquer conjunto de n vetores L.I. é base para um espaço de dimensão n. 


Exemplo 3.34. Queremos definir a transformação de R? em R? tal que 
T(1,2,0) (1,5)" 
T(o, —1ş 0) = (0, =| IN 
TO, 0, 1) = (2,4)". 


O conjunto B = (1,2,0), (0, —1, 0), (2,0,1) é L.I., e portanto é base de R3. 
Dado v € Rê, com v = (x, y, z)", determinamos sua representação na base B: 


(x,y,z) = 01(1,2,0) + a2(0,—1,0) + a3(2,0,1) 


Para determinar a1, a2 e a3, supomos x, y e z constantes e resolvemos 


al +2a3 =x 
2aı — a2 =y 
as =Z 
obtendo 
da =x— 2z 


do=2x—y—4z 


as = Z. 
E portanto, temos 


T(x, y,z) = T[01(1,2,0) + a2(0,—1,0) + a3(2,0,1)] 
= aıT(1,2,0) + a2T(0,—1,0) + a3T(2,0,1) (pelo Teoremaf3.12) 
= q1(1,5) + az(0,—1) + as(2,4) 
= (x — 2z)(1,5) + (2x — y — 4z)(0,—1) + 2(2,4) 
= (x—22z,5x— 10z) + (0,—2x + y + 4z) + (2z, 4z) 
=X 3x +y — 22). < 


Exemplo 3.35. Queremos definir uma transformação de R2[x] em M2x2 tal que 


T(x? +x) = ( 2) 


T(5x2) = z 2) 
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Observamos que { x? +x,5x2,3 } é base para R> [x] e portanto, tendo o efeito de T sobre uma base, po- 
demos determinar T. 
Usamos o seguinte isomorfismo entre estes dois espaços com Rê e Rº: 


f(ax? + bx +c) = (a, b,c)! 


a? B) =(% B, y, 5)" 
y ô 


S(v)=g "oT of= g~'(T(f(v))) 


Assim, definimos S : R2 — R4 como 


e consequentemente, 


como fica claro no diagrama a seguir. 


f 
Rox] Rº 
T 5 
M2x2 E Rt 
g 


Agora, como 


| 
ca 
KER 
ar 
o 
E 


temos os valores de S para tres vetores, 


S(1,1,0)" = (0,2,3,1)" 
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S(5,0,0)" == (—1,0, 0, —1)" 
S(0,0,3)" = (1, 1,1,0)". 


Todo vetor em R? pode ser representado como combinação linear da base { (1, 1,0)", (5,0, 0)", (0,0,3)" }, 
portanto 


(p, q,r)! = A] (1, 1,0)" TE a2(5,0,0)" tr a3(0,0,3)" 


Resolvemos então 


q +5a2 =p 
a = q 
3a3 =r 
e obtemos 
a =q 
az =(p- q)/5 
as = r/3. 


Finalmente, podemos determinar a expressão geral de S(p, q,r). 


S(p, q,r)" =S É (i) + a2 (3) + a3 (3) 
0 0 3 


1 5 0 
= qS (G) +azS (3) + ass (o) (pelo Teoremaf3.12) 
0 0 3 
0 —1 1 
= É + d2 A + a3 
1 —1 0 
a 
= 2 (M 0 “11 
ss | o] 
1 —1 0 
sÊ (q —p)/5 r/3 
q 0 r/3 
= + + 
3q 0 r/3 
q (q—p)/5 0 
r/3+(q—p)/5 
= r/3+2q 
1/3 +39 
q+(q—p)/5 
r/3+[(q—p)/5 
= r/3+ 2q 
r/3+43q 
(6q—p)/5 
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Expressando a transformação como T : R2[x] > M2x2, 


T(px? + qx +r) = e (g—p)/5 2q+r/⁄3 ) l a 
3q +r/3 (6q — p)/5 


3.2 Kernel e imagem 


O kernel de uma transformação linear é análogo ao conceito de raízes de uma funçãd?] 


Definição 3.36 (Kernel de uma transformação). Seja T : V — U uma transformação linear. Então 
ker(T) = {v € V: T(v) =0}éo0 kernefi](ou núcleo) de T. 


Definição 3.37 (Imagem de uma transformação). Seja T : V — U uma transformação linear. Então 
Im(T) =(T(v) : v € V} é a imagem de T. + 


Exemplo 3.38. Considere a transformação linear T : Rĉ — R? definida a seguir. 


Tits y) = (x+y,y =x)" 


O kernel de T é o conjunto dos vetores com T (v) = 0, ou seja, 
ker(T) = { (x,y): x+y =0ey—-x=0}. 
Para x+y = 0e y —x = 0 há uma única solução, com x = y = 0, e portanto ker(T) = {(0,0)"} = {0}. « 
Exemplo 3.39. A transformação T : R? — R? dada por 
JT J! 


T(x, y) = (x,2x 


A imagem de T é{ (x,2x): xER} 
T(v) resultará em (0,0)! para todo vetor v = (0, y)", e portanto o kernel de T é 


ker(T) = { (0y): yER} « 


Exemplo 3.40. A operação de rotação em R? tem como imagem o próprio R?, porque todo vetor pode ser 
resultado da rotação de outro. Além disso, o kernel desta operação é ( 0 }, porque somente a origem (0,0)", 
quando rotacionada, resulta novamente na origem. < 


Exemplo 3.41. Mencionamos que a derivada é uma transformação linear no espaço das funções deriváveis. 
O kernel desta transformação é o conjunto de funções que tem a derivada igual a zero - ou seja, o conjunto 
de todas as funções constantes. « 


2As raízes de uma função f são os pontos x de seu domínio tais que f(x) = 0. Por exemplo, se f(x) = x2 — 4, as raízes de f são +2 
e—2. 

*Em Álgebra Linear, o kernel é o conjunto de elementos que levam em zero. De maneira mais abstrata, pode-se dizer que é o 
conjunto que leva ao elemento neutro. Para certas funções definidas em grupos, o kernel é (x € G : f(x) = 1). 
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Exemplo 3.42. Considere a transformação T : Rz[x] — Cº, definida a seguir. 
T(a2x? + ax + do) = a2 sen? (x) + aj cos? (x) + ao 


A imagem de T é a de todas as combinações lineares das funções sen? (x), cos? (x) e f(x) = 1. 
O kernel de T é composto pelos vetores que levam à função zero, ou seja, nas funções g(x) tais que 


g(x) = a2 sen? (x) + aı cos? (x) + ao = 0 


Como isto deve valer para todo x, devemos presumir que sen? (x) > 0 e cos? (x) > 0, e como seno e cosseno 
e f(x) = 1 são LI, g(x) só é zero quando 


aı = Q2 = ~ 00, 
e portanto o kernel de T é composto dos polinômios da forma 
p(x) = ax? + ax— a. < 


Exemplo 3.43. Seja f definida em Mn xn da seguinte maneira: a matriz A é transformada em outra matriz 
B, onde cada elemento b;; da diagonal de B é igual à soma da linha i menos a soma da coluna i, e os 
elementos de B fora da diagonal são zero. O exercício [69]pede a demonstração de que f é linear. 


12 1 -1,0 0 
fio 1 1]=|[ 0 —4 0 
4 3 — 0 05 


A imagem de f é o conjunto das matrizes diagonais n x n. 
O kernel de f é o conjunto das matrizes onde o somatório de cada i-ésima linha é igual ao da i-ésima 
coluna. « 


Teorema 3.44. Seja T: V — U uma transformação linear. Então ker(T) é subespaço de V e Im(T) é subespaço 
de U. 


Demonstração. Temos ker(T) C Ve Im(T) C U, portanto precisamos demonstrar apenas que O está em 
ambos os conjuntos, e que são fechados sob multiplicação por escalar e adição. 

(ker, i) O zero está no núcleo de T. Claramente é verdade, porque T(0) = 0. 

(ker, ii) A multiplicação por escalar é fechada em ker T. Mostraremos que um vetor do núcleo de T, quando 
multiplicado por escalar, continua em ker T. 

Suponha que v € ker T, ou seja, 


T(v) =. 
Se multiplicarmos os dois lados por c, temos 
cT(v) = co 
cT(v)=0 (em todo espaço vetorial, cv = 0) 
T(cv)=0 (T é linear) 


Mas a última linha significa que cv está no núcleo de T. 
(ker, iii) A soma de vetores é fechada em ker T. Mostraremos que, dados dois vetores no núcleo de T, sua 
soma também é parte de ker T. 
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Suponha que v, w € ker T, ou seja, 


Então 


T(v+w)=T(v)+T(w) (porque T é linear) 


o que significa que v + w está no núcleo de T. 

Agora tratamos da imagem. 

(Im, i) O zero está na imagem de T. Claramente é verdade, porque T(0) = 0. 

(Im, ii) A multiplicação por escalar é fechada em Im T. Mostraremos que um vetor da imagem de T, quando 
multiplicado por escalar, continua na imagem de T. 

Seja c um escalar, e suponha que w € Im T, ou seja, 


T(v)=w, paraalgumveV 
Como v € V, e V é espaço vetorial, então cv € V. Mas isto imediatamente nos permite escrever 


T(cv) = clv 
= CW. 


Assim, se w € Im T, então cw € Im T. 

(Im, iii) A soma de vetores é fechada em Im T. Mostraremos que, dados dois vetores na imagem de T, sua 
soma também é parte de Im T. 

Suponha que w, z € Im T, ou seja, 


T(v)=w, paraalgumveV 
T(u)=z, paraalgumu €V 


Então 
T(v+u)=T(v)+T(u) 
=W+2z 
o que significa que w + z é imagem de u + v - ou seja, a soma w + z está na imagem de T. E 


Exemplo 3.45. A transformação T : R? — Rº com T(x,y,z)! = (x,x + y + z, 2x)! tem como imagem, 
evidentemente, os vetores da forma (x, x + y +z, 2x)! (estes formam um plano). O kernel desta transfor- 
mação é composto pelos vetores com x = Oe y + z = 0 (é uma reta). Os dois (uma reta e um plano, ambos 


passando pela origem) são espaços vetoriais. Mais rigorosamente, temos: 
* Ambos são subconjuntos de R3. 


e (0,0,0)! E kerT,e (0,0,0)! € ImT. 
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* ImT é fechada sob soma: 

(xx +y +z, 2x)! +(x, x +y’ dz) = (x+x, x +x +y +y +z+z,2(x+x')". 
* Im T é fechada sob multiplicação por escalar: 

c(x,x +y +z, 2x)" = (cx, cx + cy + cz,2ex)!. 
* ker T é fechado sob soma: se T(v) = (0,0,0)", T(u) = (0,0,0)T, 
T(u +v) = T(u) + T(v) = (0,0,0)", 
e portanto u + v € ker T. 

* ker T é fechado sob multiplicação por escalar: se T(v) = (0,0,0)", 


cT(v) = c(0,0,0)! = (0,0,0)! € ker T « 


3.3 Nulidade e posto 


Definição 3.46 (Nulidade e posto). Seja T uma transformação linear entre espaços de dimensão finita, A 
nulidade de uma transformação T é a dimensão de ker(T). O posto de T é a dimensão de Im(T). + 
Exemplo 3.47. Seja T : R? — R$, definida a seguir. 

Tea)” = (x;y, x + y)". 


A imagem desta transformação é um plano, contendo vetores da forma (x,y, x +y)". Uma base para este 


gi (9) 


Como a base da imagem tem dois vetores, o posto de T é dois. 
O núcleo de T é composto pelos vetores v tais que T(v) = 0, ou seja, 


-e 


Ou seja, 
x=0 
y=0 
x+y=0 


Estes são os vetores da forma (0,0, z)! - uma reta. Uma base para o núcleo é, portanto, 


(9) 


Como a base do núcleo tem um único vetor, a dimensão do núcleo é um. «a 
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Exemplo 3.48. O exemplo[3.9Jmostra a transformação que realiza rotação de vetores em R?. O kernel da 
transformação contém somente o vetor zero, porque qualquer outro vetor em R2, quando rotacionado, 
resulta em vetor diferente de zero. Já Im(T) é igual a todo R?, porque todo vetor pode ser obtido como 
rotação de outro. 

Como o kernel de T é ( 0), sua nulidade T é zero. O posto de T é dois (a dimensão de R?). < 


Exemplo 3.49. O exemplo [3.5Jmostra que a derivada em Rn [x] é transformação linear. A imagem desta 
transformação é Rn 1 [x], e o kernel é o conjunto das funções constantes (que são as que tem derivada 
zero). 

A nulidade da transformação é um (porque a imagem pode ser gerada a partir de um único vetor, a 
função constante f(x) = 1). O posto é n (a dimensão da imagem, Rn 1 [x]). < 


Exemplo 3.50. Considere o operador derivada segunda, d? /dx?, no espaço R4[x]. Para um polinômio 
qualquer deste espaço, temos 


2 


d 
—— (aux! + ax) + a2x? + ax + ao) = 12a4x? + 6x3 + 2a». 
dx? 


A imagem de d?/dx? é composta, portanto, de polinômios de grau no máximo dois. Uma base para a 
imagem é 
Br = {1,x, x’), 


e portanto o posto de d? /dx? é tres. 
Já o núcleo deste operador é composto pelos polinômios que são transformados no polinômio zero. 
Estes são, claro, os de grau no máximo um, ou seja, os da forma 


aıx + do. 
Uma base para o núcleo é portanto 
BN Si {1 Xh 
e a nulidade de d? /dx? é dois. « 


Teorema 3.51 (do núcleo e da imagem). Sejam V e U espaços vetoriais de dimensão finita e T : V — U uma 
transformação linear. Então a soma da nulidade com o posto de T é igual à dimensão de V - ou seja, dim Im(T) + 
dimker(T) = dim V. 


Demonstração. Seja (u1,u2,...,ux } uma base para ker(T) com k vetores. Podemos completar esta base 
para formar uma base 
Tu,u2,.. 5 Uk, W1,W2,..0,Wm ) 


para V. Temos então 


dimker(T) =k 
dmV=k+m. 
Para mostrar que dim Im(T) = m, mostraremos que o conjunto { Tw1, Tw2,..., TWm } é uma base para 
Im(T). 


Todo vetor v € V é combinação linear de vetores da base de V, portanto 


v = qu +... + akUk + bw; +...+tbnWm 
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Tv=aT(u)+...+acT(u) +byT(wi) +... + bn T(Wm) 
= bı T(w1) +... +bmT (wm). (porque T (u; = 0)) 
As duas últimas linhas acima mostram que todo vetor T(v) é combinação linear dos vetores T(w;), e por- 
tanto mostramos que os vetores T(w;) geram a imagem de T. Para que formem uma base, resta mostrar 


que são um conjunto L.F] 
Considere agora uma combinação linear qualquer de vetores Twi, e suponha que ela seja igual a zero: 


cıT(w1) +... +CmT(Wm) =0. 


Mostraremos a seguir que isso implica em todos os c; serem iguais a zero - e portanto o conjunto dos Twi 
é LI 
Como T é linear, podemos reescrever a equação na forma a seguir. 


T(ciwi +... + CnWm) =0 


Ou seja, W = C1W1 +... + CmWm E ker(T). 
O kernel de T é gerado pelos u;, portanto w, estando no kernel, é combinação linear dos u;: 
W =C1W] +... F CmWm 
W = Z1U1 + Z2U2 +... + Zkuk. 
ou seja, 
(c1W1 +... + CmWm) = (zU +Zz2U2 +... + Zkuk) 


O que é o mesmo que 


(ciwi +... +CmWm) + (—z1U1 — Z2U2 — . . . — Zkuk) = 0. 


No entanto, os w; e u; formam base para V, e são todos L.I. - e todos os c; e z; acima devem necessariamente 
ser iguais a zero. Desta forma, como os c; devem ser zero, os vetores T(w;) são L.I. 
Como mostramos que a imagem de T tem uma base com m vetores, temos dim Im(T) = m. E 


Exemplo 3.52. O exemplo[3.39]mostra a transformação T(x, y)" — (x,2x)" emR?, comker(T) ={(0,y)" : 
y € R}eIm(T) =[(x,2x): xe Rj 
A dimensão de ker(T) é claramente um - uma base para ker(T) poderia ser, por exemplo, o conjunto 
((0,1)7). 
Para Im(T), a base pode ser (1,2)”, já que os vetores de Im(T) são todos múltiplos deste. Assim, 
dim Im(T) = 1. Temos então 
dimker(T) + dim Im(T) = dim Rĉ. < 


Exemplo 3.53. Considere a transformação T : (x,y,z)! = (x + y, z) de R? em R2. 
A imagem de T é RŽ. O kernel de T é 
ker(T) = { (a,—a,0)': aER}, 


porque para que x + y resulte em zero, y deve ser igual a —x. 
o kernel de T poderia ser gerado, portanto, pela base {(1,—1,0)T}, e temos a nulidade de T igual a 
dim ker(T) = 1, e o posto de T igual a dim Im(T) = 2, e a soma de ambos é dim R? = 3. < 


“Mostrar a independência linear destes vetores é essencial nesta demonstração, porque estamos mostrando qual é a dimensão da 
imagem. Se houvesse vetores sobrando, estaríamos superestimando a dimensão. 
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Exemplo 3.54. Já verificamos no exemplo que a derivada em R, [x] tem imagem igual a R, 1 [x], e 
seu kernel é o conjunto das funções constantes. 


dim Rn [x] = dim R, 1 [x] + dimk, 


onde K é o conjunto das funções constantes de R em R. Temos que a dimensão de K deve ser necessaria- 
mente um. De fato, podemos escrever qualquer função constante como múltipla de f(x) = 1,e portanto 
f(x), um único vetor, é base para K. < 


Exemplo 3.55. Em Man xn, a função que dá o traço (somatório da diagonal) de uma matriz é Tr: Mnxn — 


R. Sabemos que 


dim Mnxn =n2. 


E sabemos que Im Tr = R, portanto 
dimImTr = 1. 


Assim, mesmo sem termos determinado o kernel de Tr, sabemos que sua dimensão é necessariamente 
dimkerTr=n? — 1. 
E realmente, para que Tr(A) = 0, precisamos que 
am + a22 +: + ann =O, 


independente dos valores no resto da matriz. Podemos gerar todas estas matrizes (com traço zero) como 
combinação linear de n? — 1 vetores: para cada posição i,j na matriz, exceto na posição n, n, incluímos a 
matriz com aij = 1, e definimos ann de forma que o traço seja zero: 


10 0 0 0 001 000 
00 O)sl0 OJ-{0 0 0)5/1 0 0)» 
00 —1 0 0 000 000 
00 0 0 0 000 000 
k 1 o). (0 i) (e 0 o): (6 0 o). 
00 —1 000 100 010 


Estes oito (32 — 1) vetores geram matrizes com traço zero. Não usamos nove vetores porque o último 
elemento da matriz depende de outros elementos (é zero quando a diagonal é zero, e —1 quando há 1 na 
diagonal). 

Observe que escolhemos a posição n, n arbitrariamente. Poderíamos ter usado a posição 1,1 ou 2,2 
para “compensar” o 1 em outro lugar da diagonal. Teríamos matrizes como 


1 00 010 
0 —1 0); 00 0), etc < 
O 00 000 


Os teoremas a seguir tratam de transformações bijetoras, injetoras e sobrejetoras. 


So 004 


Teorema 3.56. Uma transformação T é injetora se e somente se ker(T) = (0). 


Demonstração. (=>) Se T é injetora, então há um único x tal que T(x) = 0. Como O € ker(T), então x deve 
ser0,eker(T) = (0). 

(<=) suponha que ker(T) = { 0 }, e que há dois vetores x, y com T(x) = T(y). Então T(x — y) = 0, e 
x—y € ker(T). Mas somente 0 € ker(T),e portanto x — y = 0, e x = y - ou seja, T é injetora. E 
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Exemplo 3.57. Seja T : R? — R? uma transformação linear tal que T [(x1,x2,x3)]" = (2x3,0,3x1)T. De 
imediato observamos que não pode ser injetora, porque seu kernel não contém apenas o vetor zero - todos 
os vetores da forma (0,k,0)! também são levados por T ao zero, e portanto também estão no kernel de T. 

Podemos também expor o fato de outra forma: como há mais de um vetor tal que T(v) = 0, há mais de 
um vetor levando a um único elemento do contradomínio, portanto a transformação não é injetora. < 


Exemplo 3.58. Seja O um ângulo. A transformação que rotaciona vetores em R? por O é injetora, porque o 
único vetor que pode resultar no vetor zero depois de rotacionado é o próprio vetor zero (ou seja,o kernel 
da transformação contém somente o zero). < 


Exemplo 3.59. A dimensão da transformação definida pelo traço de matrizes quadradas é um, portanto o 
traço não é uma transformação injetora. De fato, é fácil construir duas matrizes com o mesmo traço. « 


Teorema 3.60. Seja T : V — U uma transformação linear. 
i) Sedim V < dim U, T não é sobrejetora. 
ii) Sedim V > dim U, T não é injetora. 


iii) Se dim V = dim U eo posto de T é dim V, então T é bijetora. 


3.4 Aplicações 


3.4.1 Transformações em imagens 


Já verificamos que é possível representar a rotação de um ponto por um ângulo O como transformação 
linear. Se tivermos uma imagem a ser mostrada na tela de um computador (ou de cinema), podemos realizar 
atransformação em cada um dos pontos - o efeito será o de transformar a imagem inteira. A figura a seguir 
mostra a rotação de todos os pontos de uma imagem por um ângulo de —71/3. Esta transformação é dada 


por 
T EY = o n/3)— ysen( |) q 1 ( A 
y xsen (—71/3) + y cos (—7/3) 21-xv3+y 


A 


Há diversas outras transformações em R? que também são importantes em Computação Gráfica. Listamos 
algumas delas nesta seção. 

A reflexão por qualquer reta que passe pela origem é uma transformação linear. As reflexões pelas retas 
y =x, y = —x e x = 0 são realizadas, respectivamente, pelas transformações 


"okola ol) 


A figura a seguir ilustra a segunda delas (T2, reflexão pela reta y = —x). 
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4 Cf 


R 
é Q 
O cisalhamento também é transformação linear, que consiste em somar um múltiplo de uma das coordenadas 


do vetor a outr a. F or exemplo, 
y y 


é uma operação de cisalhamento. Geometricamente, o cisalhamento realiza uma deformação como a mos- 
trada na figura a seguir. 


bed 


A mudança de escala é uma transformação linear. Se quisermos multiplicar a escala no eixo x por a e no eixo 


y por b, usamos a transformação 
X — | QAX 
H0- 


que é linear. Por exemplo, os pontos da figura abaixo foram modificados usando a transformação T[(x, y)"] = 
(3x, y/2) r 


ZTA 


O deslocamento por uma distância fixa é chamado de translação. A figura mostra uma translação da imagem 
do triângulo, para a direita e para cima. 
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A Là 


A translação, no entanto, não é uma transformação linear: para deslocar um ponto em um dos eixos 
por uma distância k, precisaríamos realizar a transformação 


RAST") 
y y 
que não é linear (claramente, já que T[(0,0)"] = (k, 0)", levando o vetor zero a algo diferente de zero. 


Apesar da translação não ser transformação linear de R? em R?, podemos usar uma coordenada a mais 
para obter uma transformação linear de R? em R3. 


HO 


E representamos todos os pontos como (x,y, 1 P: Assim ao invés de somar uma constante k a x, somamos 
um múltiplo de z (que decidimos que será sempre 1). Esta é a abordagem da Geometria Afim, descrita no 
Capítulo[13] 

Há excelentes livros abordando a Computação Gráfica, como o de Jonas Gomes e Luiz Velho eo 
de Peter Shirley, Michael Ashikhmin e Steve Marschner [Samos]. 


Exercícios 


Ex. 58 — Em alguns exemplos, afirmamos que certas funções são transformações lineares, mas não o de- 
monstramos. Verifique essas afirmações (troca de coeficientes no exemplo multiplicação de linha no 


exemplo[3.17). 

Ex. 59 — Diga se as funções a seguir são transformações lineares. 
i) T: R? > R?,tal que T(x, y, z) = (x +y,z). 
ii) T : R2 => C, com T(x,y}= (x — y) + (x + y)i 


iii) No espaço das funções deriváveis de R? emR, 


o) 
Titol = Sel) + | ly) dy. 


iv) No espaço das funções de RŽ em R, 


Tinu) = (Zt) (ffov ay) 
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v) T : Mnxn — R, com T(A) igual ao produtório dos elementos da diagonal de A. 


Ex. 60 — Neste Capítulo, para mostrar que uma transformação T : V — W é linear sempre mostramos 
primeiro que para todo c escalar e todos v € V,w € W, T(v+w) = T(v)+T(w), depois que T(cv) = cT(v). 
Mostre que isso é o mesmo que mostrar somente que T(cv + dw) = cT(v) + dT(w). 


Ex. 61 — Na demonstração do teorema/3.12)(na página|86) usamos o seguinte argumento: “cT(0) = T(0), 
o que implica em c = 1 ou T(0) = 0”. Demonstre esta afirmação. 


Ex. 62 — Construa o operador em R? que rotacionan um ponto por um ângulo O ao redor da origem, 
mantendo a segunda coordenada fixa (o ponto (x,y,z)! é mudado para (x',u,z')!). Mostre que este 
operador é linear. 


Ex. 63 — Demonstre o teorema[3.20] 
Ex. 64 — Demonstre a proposição[3.31] 
Ex. 65 — Demonstre o teorema[3.60] 
Ex. 66 — Demonstre o teorema[3.13] 


Ex. 67 — O exemplo|3.55|mostra uma base para o espaço das matrizes 3 x 3 com traço zero. Mostre outra 
base para este espaço, onde as matrizes não tenham zeros. 


Ex. 68 — Seja f uma função de mudança de base (que tem como argumento as coordenadas de um vetor 
em uma base B em um espaço de dimensão n, e retorna as coordenadas deste vetor em outra base B’). 
Determine o posto e a nulidade de f. 


Ex. 69 — Mostre que a transformação f dada no exemplo[3.43fé linear. 
Ex. 70 — Calcule o posto e a nulidade da transformação f, dada no exemplo 


Ex. 71 — (Difícil) Verificamos que a rotação em R? é um operador linear. Em A? (onde os pontos tem como 
coordenadas números algébricos), podemos usar o mesmo operador para rotação? 


Ex. 72 — Seja À = (ar,az, Š: san) uma matriz com colunas a;. A operação que transforma A em 


(o, a1,ã2,...,8n-1 ) - ou seja, desloca as colunas de A para a direita - é uma transformação linear? 


Ex. 73 — Levar uma matriz qualquer para a forma escalonada reduzida é uma transformação linear? Caso 
seja, determine sua nulidade e posto. 


Ex. 74 — A mudança de coordenadas cartesianas para polares (ou a inversa, de polares para catrtesianas) 
é linear? 


Ex. 75 — Sejam f e g transformações lineares tais que fog seja bem definida. Quais são o posto e a nulidade 
de f o g, em termos do posto e da nulidade de f e g? 


Ex. 76 — Naseção dissemos que o deslocamento em um eixo por uma distância fixa não é transfor- 
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mação linear. Mostre que isso vale para deslocamentos em qualquer direção, e não apenas um dos eixos. 


Ex. 77 — No exercício|3.10jmostramos que a esperança para variáveis aleatórias discretas é transformação 
linear, Mostre que para variáveis aleatórias contínuas a esperança também é linear. 


Ex. 78 — A mediana é uma transformação linear? 


Ex. 79 — Dê um exemplo de transformação linear no espaço de ciclos de um grafo (descrito no exem- 
plo . Descreva algebricamente e ilustre com um exemplo particular, desenhando os grafos. 


Ex. 80 — No espaço C!, a derivada é uma transformação linear injetora? 


Ex. 81 — Considere o conjunto de pares de funções reais deriváveis, C! x C! = (f,g) |f,gge CI. 


i) Verifique que se usarmos as operações (f, g)+ (F, G) = (f+F,g+G) e c(f,9g) = (cf, cg) o resultado 
é um espaço vetorial. 


ii) Determine a dimensão desse espaço. 


iii) Determine a imagem e o kernel da transformação 
d d? 
definida nesse espaço. 


Ex. 82 — Um operador linear f em um espaço V é nilpotente se existe algum inteiro k tal que f*(v) = 0, 
para todo v € V. Mostre como construir um operador nilpotente f em um espaço de dimensão n tal que 
f”! (v) Æ Oparaalgumv € V, mas f” (v) = O paratodov € V. Calculeo posto de f* paratodo 1 < k < n. 


Ex. 83 — Considere transformações lineares de R” em R”. Diga se tais transformações preservam: 


i) retas (se aplicarmos a mesma transformação em todos os pontos de uma reta, o resultado será outra 
reta?) 


ii) planos (idem, para planos) 


iii) ângulos (se aplicarmos a mesma transformação em todos os pontos de duas retas, o ângulo entre elas 
pode mudar?) 


iv) proporção entre distâncias em uma mesma reta (se aplicarmos ua mesma transformação linear em 
uma reta contendo pontos P, Q, R, a razão das distâncias PQ/QR muda?) 


Ex. 84 — Sabemos que em Mnxn o posto do traço é 1, e que sua nulidade é n? — 1. Determine o posto e 
a nulidade de f : Mn xn, com 
HM) =(TrM,Tr'M), 


onde Tr’ M é o traço secundário de M (a soma dos elementos da diagonal secundária). 
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Capítulo 4 


Matrizes e Transformações Lineares 


Neste Capítulo verificamos que transformações lineares podem ser representadas como matrizes, e anali- 
samos diversas consequências disso. 


4.1 Representação de transformações como matrizes 


Da mesma forma que a multiplicação de vetores den elementos por qualquer matriz de n linhas, resultando 
em outro vetor de n elementos, é uma transformação linear, mostraremos que toda transformação linear 
de um espaço V em um espaço W, ambos de dimensão finita, pode ser descrita como matriz, de forma que 
a aplicação da transformação seja também descrita como multiplicação de matrizes. 

Estabeleceremos portanto que matrizes m x n são equivalentes a transformações lineares de R” em 
RM, 
4.1.1 De matrizes para transformações 
Começamos mostrando que toda matriz representa alguma transformação linear. 


Teorema 4.1. A multiplicação por matriz m x n é uma transformação linear de R” em RM, 


Demonstração. Se x € R”, e A tem m linhas, então Ax será um vetor com m linhas, 


T 
mj») 
l 


—3s 
| 


1 
m 
l 


portanto é uma transformação de R” em R™. Nos falta mostrar que é linear, mas isto é evidente por 
propriedades de multiplicação de matrizes: (i) (Acx) = cA(x) e (ii) A(x +y) = Ax + Ay. E 
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Exemplo 4.2. Temos a seguir uma matriz 3 x 2. 


20 
A=|-32 
15 


Esta matriz representa uma transformação de um espaço de dimensão dois em um espaço de dimensão 


três: 
2 0\ EA 2x1 
Ax=|—3 2 lo -3x1 + 2x2 
1 5/ V2 


x1 + 5x2 


Note que os vetores (x1,x2)! e (2x1, —3x1 + 2x2,x1 + 5x2)! são vetores de coordenadas, e que portanto 
poderiam representar vetores de R”, Rn.1 [x], ou quaisquer outros espaços com as dimensões dadas. « 


A o o) 
101 


representa uma transformação linear de Z3 em Z4, porque a multiplicação de A por um vetor em Z3, 
usando as operações de Z2, nos dá 


Exemplo 4.3. A matriz 


E a função 


é linear. a 


4.1.2 De transformações para matrizes 


Já mostramos que toda matriz representa uma transformação linear. Agora mostramos a recíproca: toda 
transformação linear pode ser representada por uma matriz. 
As funções lineares f : R? — R são todas da forma 


f(x,y) = ax + by. 


De maneira mais geral, as funções lineares g : R” — R (ou seja, as funções com argumento vetor em R” 
e valor em R) são da forma 


g(x1,X2,.-5,Xn) = 0X + q9x2 +: + aAnXn- 


Se K é um corpo, uma transformação linear de K” em K é unicamente identificada por n coeficientes 
a1,2,..., An, de forma que 


n 
T(x) = ax + a2Xx2 ++ anXn = y QiXi 


i=1 
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Exemplo 4.4. A média f(x1,x2) = (x1 + x2)/2 é linear em Rº, e é representada por 


0 — 1/2 
az = 1/2, 
porque 
+ 
Q1X1 + d2X2 = a 2 E f(x1,x2). < 


Considere uma transformação T agindo em um vetor x, que denotamos T(x). Se representarmos T por 
um vetor linha e x por vetor coluna, o produto Tx é exatamente o valor de T(x): 


= Q1Xı + ax + -+ +anXn = T (3). 


a 
Exemplo 4.5. A função F : R? — R, tal que f(x,y,z) = 2x — z, é representada por 


(2 0 -1), 


X 
(2 0 -o (Y a-z « 
Z 


Exemplo 4.6. A transformação T : Z$ — Z2, dada por T(abcd) = a & b & c é representada por 


porque 


(io 1) 


porque 
a 
1101) E =a9b9d. 
d 
Observamos que como o corpo usado é Z2, as operações usadas na multiplicação de matrizes são as desse 
corpo. « 
Lema 4.7. Sejam U e V espaços vetoriais de dimensão finita, e seja {€1, €2, . . . , €n } base canônica para u. Seja 


também T : U — V linear. Se T(u) = v, então a i-ésima coordenada de v é combinação linear das coordenadas de 
u. Em outras palavras, se 
n 
u= J uje; 
j=1 


então existem coeficientes qi; tais que 


n 
Vi Je qijuj 
j=1 
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Demonstração. O vetor u é combinação linear da base: 


n 
u= U;€;; 


i=l 


e como T é linear, temos 


v=T(u) 
= TÁ DI wej) 
j=1 
= ta u;T(e;) (4.1) 
j=1 
Seja ti; a i-ésima coordenada de T (ej): 
big = [re]. (4.2) 


De[4.1Je[4.2] concluímos que 


Exemplo 4.8. Seja T : R? — Rĉ, com 


2x+z 


As coordenadas do vetor resultante (x — y e 2x + z) são evidentemente funções lineares de x,yez. «4 


Teorema 4.9. Sejam U e V espaços vetoriais de dimensão finita com bases canônicas A e B. Então toda transfor- 
mação linear T : U — V pode ser representada na forma de uma matriz M, de forma que T(u) = v se e somente se 
Mlula = [vlp. 


Demonstração. Usando o Lema [4.7] para cada coordenada de v, chegamos à fórmula de multiplicação de 
matriz por vetor. A i-ésima posição da multiplicação Mu é exatamente 


m 
(Mu); =} um. E 
j=1 


As figuras a seguir ilustram o conceito: cada coordenada de y é combinação linear dos coeficientes de 
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Qi Q12 > am yı 
a21 Q22 ° Am X1 y2 
- XxX | |: 
Qil Giz ° Gin : Vi 
Xn 
Ami Am2 t’ Amn Ym 


Assim, cada coordenada pode ser representada como a multiplicação de um vetor linha pelo vetor co- 
luna x. Posicionado os vetores uns sobre os outros: 


(am an an =Y 
(a21 a22 jak azn) x =y2 
(amı Am2 ce: amn) X = Ym 
chegamos a uma matriz: 
01 Q12 tt Ain yı 
a21 a22 ` Azn |; =| 82 
Ami Am2 + Amn Ym 


Exemplo 4.10. A transformação T : R? — RŽ, dada por 


TI(a,b,c)']=(a+b,b—c)! 


11 0). 
01 —1 
Aplicamos a transformação em um vetor v multiplicando a matriz por v: 
11 0) [2] Ned < 
(1 1 E (e) y L J 
c 
Exemplo 4.11. No exemplo[3.9Jmostramos que a transformação linear que realiza a rotação de vetores em 
R2 é 
R (x) — fe ~y a 
y xsen ð + y cos O 
Esta transformação pode ser representada como uma matriz: 
R= B E . 
sen O cos O 


A multiplicação por R resulta na rotação do vetor pelo ângulo 8: 


Rv = e sao, (3) = o 4 
senð®  cos0/ AU xsen ð +y cos O 


é também descrita pela matriz 
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Exemplo 4.12. Seja T : R4 — R?, com 


T [(a, b,c, d)"] = (a +b + c, 3d, —2a)". 


1110 
Mt=| 0003). 
—2 000 


É fácil verificar que Mz (a, b,c, d)! = (a + b + c, 3d, —2a). < 


A matriz que representa T é 


Exemplo 4.13. Como qualquer espaço vetorial de dimensão finita com dimensão n é isomorfo a R”, dada 
uma transfomração t : V — W, podemos usar este isomorfismo para associar: 


* A transformação t : V — W com outra, r : R” — RM 
* Uma matriz T com a transformação t 
Por exemplo, considere o operador d? /dx? no espaço R4[x]. Usamos o isomorfismo entre R4 [x] e R?, 
f(agx! + a3x? + a2x? + aux + ao) = (a4, a3, a2, a1, ao)". 
A derivada segunda é 


d2 
qo (ax + asx + a2x? + ax + do) = 12a4x? + 6a3x + 2a2 


Como transformação de R? em R?, esta transformação é 
T(as, a3, d2, Q1, ao)! = (1204, 6a3,242)! 
A matriz que realiza a transformação de R? em R? é 
2000 
T=V0600 
0020 
Exemplo 4.14. Em Z3, considere a transformação 


T(a,b) = (ba gb). 


Esta transformação pode ser representada como matriz, de forma que 


Remi- (8 1) (8) = (00): 


Note que realizamos multiplicação de matrizes usando as operações de Zz (A e $) onde normalmente 
usaríamos - e +. < 
4.2 Propriedades da multiplicação de matrizes 


Nesta seção exploramos propriedades de multiplicação de matrizes que serão usadas no decorrer do capí- 
tulo. 
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4.2.1 Matrizes por blocos 
Primeiro abordamos a multiplicação de matrizes por blocos. 


Definição 4.15 (Partição de matriz por blocos). A partição de uma matriz por blocos é uma partição das linhas 
e colunas da matriz de forma a definir blocos (submatrizes). $ 


Exemplo 4.16. Considere a matriz 


As linhas pontilhadas mostram uma possível maneira de particionar a matriz, com duas partições de linhas 
(uma com as linhas de 1 a 3, e outra com as linhas 4 e 5); e três partições de colunas (uma com as duas 
primeiras, outra com as três seguintes, e outra com a última coluna). 

Podemos ver esta matriz como uma matriz de blocos 


A= (AAi An) 


A21 | A22 | A23 
onde 

ai] a12 a13 Q14 15 a16 

A1 = | an az» A12 = | a23 ax a25 A13 = | a26 
a31 32 a33 Q34 Q35 a36 < 
q a — [as au a “(a 

An = (41 %2 A22 = [43 a44 das Aos = | 16 
a51 052 a53 054 055 a56 


As partições, como se pode notar no exemplo, não precisam ser de mesmo tamanho. < 
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Teorema 4.18. Considere duas matrizes A e B compatíveis para multiplicação: A ém x r, B ér x n. 
Suponha que r colunas de A sejam particionadas da mesma forma que as r linhas de B - ou seja, o mesmo 


número s de partições, e a i-ésima partição das colunas de A é do mesmo tamanho que a i-ésima partição das linhas 
de B. 


A11 A12 oN Ais Am A12 Aa Aiq 
A= Az A22 | Aas B= AA A22 A2q 
Api Ap2 Aps Ası As Asq 


Então podemos particionar o produto C = AB com as mesmas partições das linhas de A e das colunas de B: 


Cm Cj -Y Cm 
C21 C22 C24 
Cpı Cp2 Copa 


O bloco Ci; pode ser calculado usando o método usual de multiplicação de matrizes, exceto que ao invés de elementos 
em linhas e colunas, multiplicam-se blocos em partições de linhas e partições de colunas: 


p 
Cj = se Ai Br 
k=1 


Exemplo 4.19. 


1 of 1/0 2131 2i0 1 
27 ]1!—2'—1 —2'_ 1 4. 10:1 0 
A a ia A IS PSA] B Ra PED) SM e do AS St E RD Doe O a 
Aa E o D AN o 
-3 3i—3i 5 0i 8.2 14 3 


C (en. Gar.) 
C21 : C22 : C23 


O bloco C22 é 


C22 = A21 B12 + A22B22 + A23B32 


-[3 — 0m 12 —3 1 
(E PEL o (ean 


-[6 —9 —24 903 8 2 11=/[23 —7 —20 < 
E 9 eye! 0 +(8, 10 1) E 19 o 

Definição 4.20 (Matriz diagonal de blocos). Uma matriz particionada em blocos é diagonal por blocos se 
somente os blocos da posição (i, i) são diferentes de zero. + 


Exemplo 4.21. Sejam 
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Então 


diag(A, T2, B) = 


onde as entradas ausentes são zero. < 


Exemplo 4.22. A seguinte matriz, 


não é diagonal por blocos, porque todos os blocos na última linha tem elementos diferentes de zero. « 


(0) exercício[89]pede a demonstração da proposição [4.23] 
Proposição 4.23. diag(A1,A2,...,Ak) ! = diag(Aj !,A5!,...,AÇ!). 


Exemplo 4.24. Seja 


com 


AY- KA cu. 


Assim, 


O a 
| 0 1/2 


É usual darmos nomes aos blocos de uma matriz. Por exemplo, dadas matrizes conhecidas A e B, 


(2 3) 


é uma matriz composta por quatro blocos. O bloco (2,2) é zero, o bloco (1,1) é iguala A e os blocos (1,2) 
e (2,1) são B e B7!. 
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Muitas vezes a notação por blocos nos permite representar famílias de matrizes: a notação determina 
a forma de um conjunto infinito de matrizes. Por exemplo, 


(39) 
0 0 
é uma matriz cuja diagonal é da forma (1,1,1,...,1,0,0,0,...,0) - ou seja, uns seguidos de zeros, que 


também podemos denotar por diag(Z, 0). Observe que diag(Z, 0) pode ser de qualquer ordem, e o tamanho 
dos blocos Z e 0 não foi especificado. 


Exemplo 4.25. A notação diag(T, 0, T) indica matrizes como 


1100:00 1. 0 0:0:0 
0:0 0:0 0 0 100:0 

> 40.010. 01» 0.0. 1,0:01» 
0:0 0:10 0.0. 0:0:0 
0'0 0:0 1 O O 0:0:1 


e todas as matrizes diagonais onde a diagonal é composta de uma sequência de uns seguida de uma sequên- 
cia de zeros e outra sequência de uns. « 


tem a primeira linha igual a (1,v1,V2,...,Vn,0)", a primeira coluna igual a (1,w1,W2,...,Wm). Se 
retirarmos da matriz a primeira coluna e a primeira linha, sobra a matriz B. 
Também é comum não usar as barras que dividem as partições. A matriz[4.3]pode também ser repre- 
sentada da seguinte forma: 
k v! 0) . 
w B 0 


4.2.2 Multiplicação por vetor é combinação linear 


A matriz a seguir, 


A multiplicação de matriz por vetor pode ser vista como combinação linear das linhas ou colunas da matriz. 
Isto nos dá uma interpretação mais útil da operação de multiplicação. 


Multiplicando à direita da matriz: combinação de colunas 


Em algumas situações representaremos uma matriz como uma sequência de vetores coluna: 


1 2 m 
ci fi c] 

1 m 
C2 C2 c2 
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Observamos que ao multiplicar uma matriz por um vetor coluna, temos 


E a EPA /a acl + azc? +... + amci” 
cl c2 crlla | _ | arc} +azcĝ +... + amc? 
él do cr/ \am aic], + azc2 +... + amc™ 
aic] azc? amci” 
1 2 m 
aıc aze AmC 
= . 2 + f 2 daca m+2 
aich azc2 ah oT 
= ac! + azc? +. ane”, 
ou seja, a multiplicação da matriz (c! ,c?,...,c™) pelo vetor (a1,a2,...,an)! é combinação linear das 


colunas da matriz, com os coeficientes ai. 


Exemplo 4.26. Pode-se calcular o produto a seguir como combinação linear das colunas da matriz. 


12 3 1 » 1 2 3 1 
-2 0 ma) Pa E -2]+t?{0]=9|-2|+4|-5 
81 0 0 d 8 1 0 0 


a+2b-3a+d —2a+2b+d 
=| —2a+2a-5d | = —5d < 
8a +b 8a+b 


Esta propriedade pode ser usada na demonstração de Lema que é pedida no Exercício[93] 
Lema 4.27. Se a soma de cada linha (ou de cada coluna) de uma matriz é zero, então as linhas (colunas) da matriz 
são LD. 
Multiplicação à esquerda: combinação de linhas 


Da mesma forma que a multiplicação Mv é combinação linear das colunas de M, a multiplicação wM é 
combinação das linhas de M. 


Exemplo 4.28. Sejam 


1 2 3 
M=|43 —8 |, w=(2,0,-1,3) 
00 2 
21 0 
Então 
wM= 2(1, 2,-3) 
—1(0, 0, 2) 
+3(2, 1, 0) 
= (8, 7,—8). « 


A justificativa é análoga à do caso anterior, para multiplicação à direita de M. 
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4.2.3 Matrizes triangulares 
Matrizes triangulares tem propriedades bastante úteis. A seguir apresentamos algumas delas. 


Proposição 4.29. O produto de duas matrizes triangulares inferiores também é triangular inferior, e o produto de 
duas matrizes triangulares superiores também é triangular superior. 


Demonstração. Segue trivialmente da definição de multiplicação de matrizes. E 


Exemplo 4.30. 


1-1 0 —1 —1 0 1 1 — —2 4 —3 
O 21 /5 0 26 31 — 0O 4 10 14 « 
O 03 0 0003 O 0 0 9 
O 00 4 0001 O 0 0 4 


Proposição 4.31. A inversa de uma matriz triangular inferior também é triangular inferior, e a inversa de uma 
matriz triangular superior também é triangular superior. 


Exemplo 4.32. A inversa de 


[202.5 
A=|0128 
0012 
0002 
é 
1x2) 2 -1 
1.101 —2 1] 
A =| 11 a 
Y o 0 ud: 


2 


Proposição 4.33. Se A é uma matriz triangular, então as entradas da diagonal de A”! são os inversos das mesmas 
posições em A. 


Exemplo 4.34. A inversa de 


AUN 


O 
— 
o 


o 0 
2/3 —1⁄3 0 0 
7/4 1/2 1⁄4 0 
-8/15 —2/15 0 1/5 


AT! = 


Observe que os elementos da diagonal de AT! são 1, —1/3, 1/4, 1/5 - exatamente os inversos dos elemen- 
tos da diagonal de A, 1, —3, 4,5. < 
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4.3 Propriedades de matrizes de transformações 


Das propriedades de matrizes derivamos também os seguintes fatos - dadas matrizes A, B, um vetor v e 
um escalar À, 


* (A+B)v= Av + By, 
e (AA)v = A(Av) = A(Av), 
* (AB)v = A(Bv), 
quando os produtos forem bem definidos. 


Proposição 4.35. Sejam T e S matrizes representando transformações lineares t e s. A composição to s, se existir, é 
representada pela matriz TS, e a soma t+ s, se for bem definida, é dada pela matriz T +S. A inversa da transformação 
t é representada pela matriz T7! 


Exemplo 4.36. Considere as transformações s : Rĉ > R3, e t : R? — Rí, tais que 


s(a, b)" = (a,a+b,2b)" 
t(x,U, BN 5 (x+y,x—y,x+zx-— z). 


Sem ainda escrever suas matrizes, calculamos a composta 


tos=t(s(a,b)") 
=t(a,a+b,2b) 


= (2a + b, —b, a + 2b, a — 2b)! (4.4) 
As matrizes das transformações são 
1 1 0 
10 
T=] ols- 
1 0 1 02 
1 0 — 
A matriz da composta é 
2 1 
Ts=|€ 51 
m 2 
1 —2 


Ao aplicarmos a matriz da composta ao vetor (a, b)", obtemos 


2 1 2a+b 
0 A (e) =|» 

1 2 b a+2b 
1-2 a— 2b 


claramente correto, pois é exatamente da mesma forma que havíamos calculado em[4.4] antes de escrever 
as matrizes. < 
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Teorema 4.37. A imagem da transformação linear representada por uma matriz A é o conjunto de todas as combi- 
nações lineares das colunas de A. 


Demonstração. Cada elemento da imagem de A é o resultado da multiplicação de A por um vetor x - ou 
seja, a combinação linear das colunas de A, onde os coeficientes são os elementos de x. Se considerarmos 
todos os valores possíveis em x, temos todas as combinações lineares das colunas de A. | 


Exemplo 4.38. A transformação com a matriz 


Ta? 
T=|22 
13 


T(x,y) = (x + 2y,2x + 2y,x + 3y), 


MD 


e tem como imagem um plano em Rĉ. Este plano é composto pelas combinações lineares 


G0 - 


Definição 4.39 (Posto de matriz). O posto de uma matriz é o posto da transformação linear representada 
por ela. + 


Segue imediatamente da definição|4.39|e do teorema[4.37]o seguinte corolário. 
Corolário 4.40. O posto de uma matriz A é igual à quantidade de colunas linearmente independentes em A. 


A imagem de uma transformação linear é o espaço-coluna de sua matriz, e portanto a dimensão da ima- 
gem (e o posto da transformação) é igual à quantidade de colunas independentes na matriz. 


Definição 4.41 (Espaço-linha, espaço-coluna, posto de linhas e colunas). O espaço-linha de uma matriz é o 
espaço vetorial gerado pelas linhas da matriz; o espaço-coluna é o espaço vetorial gerado pelas colunas da 
matriz. 

O posto de linhas de uma matriz é a dimensão de seu espaço-linha - ou seja, a quantidade de linhas 
linearmente independentes na matriz 

O posto de colunas de uma matriz é definido de forma similar: é a dimensão de seu espaço-coluna, ou a 
quantidade de colunas linearmente independentes na matriz. + 


Uma matriz m x n tem o espaço-linha gerado por m vetores-linha, e o espaço-coluna gerado por n 
vetores-coluna. As dimensões destes espaços não são, no entanto, necessariamente iguais a m e n, uma vez 
que as linhas e colunas da matriz podem não ser L.I., e neste caso não formam base para aqueles espaços. 

Muitas vezes dizemos que uma matriz quadrada de ordem n e com posto de colunas igual a n é “base” 
para R”, porque R” é seu espaço-coluna, e portanto a matriz, quando vista como uma sequência de colu- 


nas, é uma base ordenada de R”. 
1 0 1 
A= (3 2) , B= e 1 o) 
0 —1 —1 


são bases para R? e R?, porque qualquer vetor de R? pode ser escrito como combinação linear das colunas 
de A, e qualquer vetor de R? é combinação linear das colunas de B. < 


Exemplo 4.42. As matrizes 
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O lema e o teorema a seguir relacionam o posto de linhas com o posto de colunas. 


Lema 4.43. Qualquer matriz A m x n com posto de colunas r pode ser decomposta em duas matrizes, Cm x re 
Lr x n, de forma que À = CL, de forma que o espaço coluna de A é gerado pelas r colunas de C, e o espaço linha de 
A é gerado pelas r linhas de L. 


Demonstração. Seja A, m x n, com posto r. Como o posto de A é igual ao posto de colunas de A, podemos 
tomar r colunas LI de A. Pomos estas colunas lado a lado para formar uma nova matriz C, m x T. 
Dadas À e C, existe uma única matriz L, r x n, tal que 


A=cCL. 


Já sabemos que C gera as mesmas colunas que A. Resta observar que L gera as mesmas linhas que A. Mas 
no produto CL, as linhas geradas são combinações lineares das linhas de L, com os coeficientes dados pelas colunas 


de C. Por exemplo, se 
1 6 —11 1 6 
A = k 0 >) = k ) a i 1) 
5 —1 7 5 —1 


Neste exemplo, a primeira linha de A, (1, 6,4), é gerada pelas linhas de L, com coeficientes na primeira 
linha de C; o mesmo vale para as outras linhas: 


1(1,0,1) + 6(0,1,-2) = (1,0,1) + (0,6, —12) 
= (1,6,—11). (linha 1 de A) 


261,0, 1) + 0(0,1, —2) = (2,0,2). (linha 2 de A) 


5(1,0,1) — 1(0, 1, —2) = (5,0,5) F (0—1,2) 


= (5, —1,7). (linha 3 de A) 
A demonstração está portanto terminada. E 
Exemplo 4.44. Seja 
2 1 3/1 
-|3 0 3 0 
ASN AAI 0 
dA 4- 
A pode ser decomposta em 
c 
2al 1 
1010 
Or 
o3] 0001 


A matriz C claramente tem tres colunas LI, e gera as mesmas colunas que A (porque suas colunas são 
idênticas às únicas tres colunas LI de A). 
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A matriz L temtres linhas LI, e gera as mesmas linhas que A: A primeira linha de C é (2, 1, 1), indicando 
que a primeira linha de A é a combinação linear da linhas de L com coeficientes 2,1 e 1: 


1010 
(2, 1,1){0 1 1 0] =(2, 1, 3, 1). 
0001 


O mesmo vale para as outras linhas de A. < 
Teorema 4.45. Para toda matriz, o posto de linhas é igual ao posto de colunas. 


Demonstração. Seja A uma matriz m x n. Se A = 0, as duas quantidades (de linhas e de colunas L.I.) são 
zero. 

Suponha que o posto de colunas de A é r. Podemos portanto escolher r colunas LI de A. Tomamos 
estas r colunas LI e as pomos lado a lado para formar outra matriz C, e escolhemos uma matris L como 
determina o lemaf4.43] resultando em uma decomposição 


A= CL. 


Sabemos que C gera as colunas de A (e portanto o espaço coluna de A); sabemos também que L gera as 
linhas de A (e seu espaço-linha). 

Isso significa que o posto de linhas de A não é maior que a quantidade de linhas em L, que é igual a r. 
(Não provamos ainda que o posto de linhas é exatamente r, porque não provamos que as r linhas são LI.) 
Assim, 

posto linhas(A) < posto colunas(A) 


Se repetirmos o mesmo raciocínio para A! obteremos 
posto colunas(A) < posto linhas(A) 


e consequentemente, 
posto linhas(A) = posto colunas(A). E 


Exemplo 4.46. A transformação de Rf em R3, exibida no exemplo é 


T [(a, b,c, d)"] = (a +b +c,3d, —2a)". 


1110 
Mr=| 0003). 
—2 000 


A imagem da transformação é composta pelos vetores da forma (a + b + c, 3d, —2a)" - e na verdade 
qualquer vetor de R? é desta forma. Assim, o posto da transformação é três. Observamos também que a 
matriz de T tem três linhas LI, e também tem três colunas LI. 

A decomposição que mencionamos na demonstração do Teorema[4.45Jé 


A matriz que representa T é 


My =LC, 


com 
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Teorema 4.47. Se uma matriz M de ordem n tem posto estritamente menor que n, então M é singular. 


Demonstração. M representa um operador linear em um espaço V com dim V = n. Se o posto da trans- 
fomação for menor que n, a dimensão da imagem de M será menor que n. Pelo Teorema M não é 
bijetora, e portanto não tem inversa. E 


4.3.1 Mudança de base 


Uma vez que a mudança de base é uma transformação linear, como descrito na seção [2.4] ela pode ser 
descrita como matriz. Usamos a notação [idlr-,s para enfatizar que esta matriz não modifica os vetores, 
mudando apenas a base em que são descritos. Esta matriz representa a função identidade (que é uma 
transformação linear), mas levando de uma base a outra: 


lidlk-s lr = bis. 
Teorema 4.48. Sejam Re S duas bases para um espaço vetorial V com dimensão n: 


R = (r1,r2,...,rn) 


SE (S1,825..-3Sn): 
A matriz de mudança de base lidlr—s én x n cujas colunas são os vetores da base R escritos na base S: 
Mius = (tls a tuê als) 
de forma que para todo v € V, 


[vls = lidlesslvla. 


Demonstração. Primeiro observamos que se uma matriz como esta existir ela deve levar vetores r; da base 
R nos vetores s; da base S. 
Sabemos que [r;lr = ei. Assim, se aplicarmos a matriz a algum vetor r; € R, obtemos 


lidlr>slrilr = lidle=sei, 


que é a í-ésima coluna de [id]rR—s - ou seja, [ri]s, como queríamos. 
Seja então v € V um vetor qualquer. Sua representação na base R é (a1,a2,...,an)! -ouseja, 


v = qr, +: + anfa. 
Aplicamos [idlps em [v]gr: 


7 
CR (iris Be ig als) a 
dn 
= mlrils + aslrals + ---+ anlrals 
= [vls. E 
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Exemplo 4.49. Considere as seguintes bases para Rº: 


T 
y 


B = { (1,0,0)", (0,1,0 E 


3',10,0, 1)" } 
C= { (1,0,0)', (0, 20)", (0,0,3)" 
O vetor (2,4, 12)! de R? na base canônica tem coordenadas [(2, 4, 12)"]g. Já na base C o vetor tem coor- 


denadas [(2,2,4) lc: 
2(1,0,0)' +2(0,2,0)" + 4(0,0,3)! = (2,4,12)". 


Para obtermos a matriz que muda vetores da base C para a base B, listamos os vetores de C na base B: 


100 
lidlesp = 2 o) . 
003 


Verificamos que a matriz realmente transforma o vetor mencionado anteriormente, (2,2,4)! na base C, 
em (2,4, 12)", que é sua representação na base B: 


moo- i 


Teorema 4.50. Uma matriz de mudança de base sempre tem inversa. Se [id]g—p é a matriz de mudança da base 
B para a base D, então (lidle sp)! (a inversa de P) é a matriz de mudança de base de D para B, lidlp se. 


Demonstração 1. Matrizes de mudança de base são quadradas, portanto representam transformações entre 
espaços de mesma dimensão. Além disso, são construídas com colunas da base do espaço, por isso todas 
as colunas são LI, e elas sempre tem posto completo. Pelo Teorema [3.60] representam transformações 
bijetoras, e consequentemente tem inversa - por isso ([idlg-,c)”! sempre existe! 

Sejam B, C duas bases de um espaço V e v um vetor v € V. Então 


lidlg»clvlg = [vlc 
(ide ce) idas clvis = (lide)! ve 
Tivlg = (lidle=c) Ivic, 
e de acordo com a última linha, ([idlg-,c)”! realiza a mudança de base de C para B. E 


Demonstração 2. Suponha que exista uma transformação [T] x«— g que transforma a representação de vetores 
da base « para a base B. Sabemos que é possível mudar de qualquer base para outra, e portanto deve 
necessariamente haver outra transformação [S]p ,« que leve da base B para a base «. Seja então [idlg np 
a matriz de mudança da base B para a base D. Seja [vlg um vetor representado na base B. A representação 
de v na base D é [id]g— p [v]g. A representação de v na base B é 


(lides) (lides o [vlg) = (lidles0)"(lidles0)lvig = lvls, 
e portanto ([idlg sn)” ! é a matriz de mudança de base de D para B. E 
Exemplo 4.51. Temos a seguir duas bases de R?: 


B= (,0)",01,1)") 
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D= des (2,3)") 


Para obter a matriz [idlp —p escrevemos os vetores de B na base D. Precisamos então determinar os valores 
de a, b, x, y tais que 


Resolvemos os sistemas, 


e obtemos 
a=-3 x=—1 
b=42 y=4] 


A matriz de mudança de base [idlg pn e sua inversa, [idlb-,p são, portanto, 


lidlesp = Fm y) » lidos p E, . 


Escolhemos um vetor qualquer na base B, [vlg = (—5,7)". O vetor de R? com estas coordenadas é 
v=-5(,0)" +70," = (2,7)". 


para obter suas coordenadas na base D, 


Poor DC) 


Agora verificamos que estas coordenadas, na base D, nos dão o mesmo vetor: 
v=8(12)] —3(2,3)! = (2471. 


Observamos também a mudança inversa no mesmo vetor, dada por lidlp.,p: dadas as coordenadas (8, —3)!, 


[vlg = lidpselvlp = A q) (2) = E) 


as coordeandas do mesmo vetor na base B, que havíamos escolhido inicialmente. < 


Exemplo 4.52. Considere as seguintes bases para Rº: 


B= ((1,0,0)", (0,1,0)", (0, 0, DD 
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(0,6,7) = 0(1,0,0)! + 6(0,1,0)! +7(0,0,1)" 


240 
lidlg>D = k 0 s) 
057 
Verificamos que a transformação de cada vetor da base B resulta em outro da base D: 


2 
id B5D 1,0,0 T m k 


4 
0 
5 
240 0 4 
05 7/ À0 5 
240 0 0 
5 7 1 7 


Agora transformamos um vetor qualquer da base B para a base D: 


240 8 2 
O 3 À 2 9 


A inversa de P é 


dE ga 
lidos = (lideso) =| & EE 55 i 
-5 3 L 
48 72 12 
e lidp=e (12, 36,9)" = (8, 1,2)". < 


Agora obervamos que, assim como uma matriz de mudança de base sempre tem inversa, toda matriz 
invertível representa uma mudança de base. 


Proposição 4.53. Seja M uma matriz não singular de ordem n. Se fixarmos uma base B = (by,bz,...,bn) de 
tamanho n, então M representa simultaneamente: 


i) amudança de base de B para alguma base C (M = [idlg=,c); 
ii) a mudança de base de alguma outra base A para B (M = lidlasB) 


conforme ilustrado no diagrama a seguir. 


O Exercício/119|pede a demonstração da Proposição|4.53 
p P 


Exemplo 4.54. Uma matriz de rotação por 9, 


R = (elo RS 
E sen(0) cos(8) 


4.3. PROPRIEDADES DE MATRIZES DE TRANSFORMAÇÕES 131 


sempre tem inversa, 


e RNR _ [fcos(-0) —sen(—0) 
Wa =R= er o i 


A matriz Rg realiza uma mudança de base. Para sabermos qual é a base para a qual ela leva, calculamos: 


o o. (1) = sa) (epi RS (9) £ o 
sen(0) cos(0)/ \0/ — \sen(0)/ ’ sen(0) cos(0) 1 cos(0)/ ` 


Assim, a matriz leva as coordenadas de vetores de Rĉ na base canônica em coordenadas dos dois vetores 


da nova base, 
(cx) È a) 
sen(0)/ ° cos(0) 
Note que a fórmula mostra um par ordenado com duas matrizes-coluna, e não uma matriz-linha contendo duas 
matrizes. 


Seja B = {e1,e2} a base canônica para R?. Escolhemos agora O = 7/4. A matriz Rw/4 e sua inversa, 
R(-n/4) sãd'] 


1 1 
Rx/4 = 1 +1 Renan ( 114). 
a AN 1), EA „e 1 


Isto significa que se aplicarmos uma rotação por 71/4 nos vetores da base canônica, a nova base será 
Fa (fi = Rz/4€1, f2 = Rx/482) 
1 1 
(eg) 
' v2 ( U EN 


A figura a seguir mostra as bases B e F. Note que a rotação leva os dois vetores e, e ez em outros dois vetores LI 
(a mesma rotação em dois vetores não poderia torná-los colineares). 


ILembrete: sen(7/4) = cos(7/4) = cos(—71/4) = 1/2. sen(—7/4) = —1//2. Veja também a nota de rodapéfi]na páginafeo] 
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Escrevemos os vetores e4 e e2 na base F: 


Assim, temos 


Vemos que a matriz que muda da base canônica B para a base F é, portanto, a matriz de rotação R 4: 


1 
lidlg—>r = (leilr [e2]F) = Z a 1) =R ny4. 


Como a base foi rotacionada por 7/4, as coordenadas dos vetores são rotacionadas por —71/4, para compensar a 
mudança na base, de outra forma os vetores também sofreriam a mesma rotação feita na base. Por isso os 
vetores em R” são chamados de contravariantes. 

Considere agora o vetor [vlg = (2,2)! em R?, aqui descrito na base canônica. Na nova base, suas 


coordenadas são 
a DO-A 
VEN 1/ (2 0 


Vemos que o mesmo vetor que tem as coordenadas (2,2)! na base canônica tem as coordenadas (22,0) 


o mG: 


Realmente, usando os vetores fı e f2, precisamos apenas de 2v' 2 vezes fı (observe que v tem o comprimento 
da diagonal de um quadrado de lado 2): 
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Fica claro então que, fixada uma base B, uma transformação invertível sempre realiza uma mudança de 
base, e que para identificar a nova base, basta aplicar a transformação nos vetores de B. < 


4.3.2  Similaridade 


Da mesma forma que a descrição de vetores por coordenadas em R” depende da escolha de uma base, a 
representação de transformações lineares como matrizes depende, também, das bases usadas para repre- 
sentar os vetores do domínio e do contradomínio. 

Sejam V e W dois espaços vetoriais, tais que 


V tem bases «, a” 
W tem bases B, B’, 


eT : V — W uma transformação linear. A matriz que representa T agindo em vetores na base « e 
resultando em vetores na base ß é [T]x=g. 

Quaisquer vetores a € V eb € W tem representações [a] x, lalxr, [blg e [blp+. Deve existir também 
uma matriz que realize a mesma transformação da base «” para a base B’. A próxima figura ilustra este 
conceito. A matriz P muda da base À para B’; a matriz Q muda de « para «'; e as matrizes A e B realizam 
a mesma transformação, mas usando bases diferentes. 


[blg 


P= lidlg=p' lidam! = Q 


equivalentes 


< 

a 

R 
- 


"SB! 


blg, -——————— «—— alo 


> 


Se conhecemos B = [T]«.,p, podemos determinar A = [T]x'-,p + observando que 


= [id pop” T «> lid] «x x lala”, 
ou seja, 
Mag = lidg>g Tome lida 
De é 
(iii) ii) (1) 
ou 
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Note que o lado direito da expressão é mais facilmente lido da direita para a esquerda, porque a transfor- 
mação será aplicada a um vetor que ficará à direita. Lemos a expressão da seguinte maneira: (i) mude o 
vetor x da base a” para œ; (ii) aplique a transfomração T, e depois (iii) leve da base para B’. 

Dizemos que as matrizes [T] «=g; e [Tlx-— p, que representam a mesma transformação em bases dife- 
rentes, são equivalentes (como mostra também a figura anterior). 


Definição 4.55 (Matrizes equivalentes). Duas matrizes A e B são equivalentes se e somente se existem 
matrizes invertíveis P e Q tais que 
A =PBQ |. + 


Na definição[4.55] P e Q são matrizes de mudança de base. Estritamente falando, P e QT! são invertí- 
veis, portanto poderíamos também ter escrito “se existem matrizes invertíveis Re S tais que A = SBR”. 
Usamos “Q7!” para deixar claro que uma das mudanças é de alguma outra base para a base em que B opera, e 
outra mudança é a partir da base em que B opera para alguma outra. A figura a seguir deve deixar isto claro: 
partindo de [alwr, primeiro aplicamos Q”!, depois B e em seguida P, para chegarmos a [b]p», e temos 
portanto A = PBQ"!. 


£ 
õ 
P = fidlesp' a dao! =Q 
3 
Gt 
v 
M Y 
T 1 1 
b pr [ Ja >p a Ma os [alo 


> 


Seja 
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Claramente, [vla = (2,1, 3)", ou seja, v na base a é ele mesmo. Além disso, 


2 
[vla = (14) , 
E 


já que 2(1,0,0)! + 1/2(0,2,0)! — (0,0,3)! = (2,1,-3)!. 
Agora calculamos a matriz de mudança de base de « para q: 


[id] as" = (lena [x2]w” sl) 


1 0 0 
= 10 1/2 0). 
0 0 1/3 
Similarmente, obtemos 


| 100) S 15 O «q 5 0 
lides = l pA o). lidlesp' = ). lid]g'>p E $ 
eo 0 1/2 0 —2 


A transformação T pode ser representada como matriz, levando vetores na base « na base f: 


Calculamos agora a matriz de T para as bases «' e B’: 


Morse" = ldg Map lida a 


o (18 A 
— AQ —1/2 


ap 1/5 2) 
0 0- 
Ei 2/5 à 

o ota 


De fato, 


Verificamos que 
TIO, 1,3)" == (3, —6)", 


3/5(5,0)! +3(0,-2)! = (3,-6)T. < 
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Se considerarmos um operador linear T : V — V e duas bases « e x” para o espaço V, temos 
Mas = [id] aa! [T] aa lidas» 


ou 
A =SBS. 


Dizemos que as matrizes [Tl e [Tao são similares. Isto é conceitualmente o mesmo que dizer que 
as duas matrizes são semelhantes, exceto que temos o domínio igual ao contradomínio (e portanto temos 


P = Q na definição[4.55). 


Definição 4.57 (Matrizes similares). Duas matrizes A e B são similares se e somente se existe uma matriz 
S tal que 
A = SBS7!. + 


Damos a seguir um exemplo simples, sem a interpretação das matrizes como operadores de mudança 
de base, e um outro, mais extenso, onde tratamos das matrizes S e ST! como matrizes de mudança de base. 


Exemplo 4.58. Sejam 


1 40 z 10 2 7 12 14 —1 00 
S=|0 01), S =ļ|0 0 —1/⁄22]|, A=| 0 1 2), B=| 2 03]: 
0 —2 0 01 0 —4 —6 —8 0 —4 1 


As matrizes A e B são similares, porque A = SBS7!. « 


Exemplo 4.59. A seguir temos duas bases para R?: 


C= ((1,2)8 (0,1)"), 
D = ((0, D’, (2,2)"). 
Definimos uma transformação T : R? — R? como 
T(x, y) = (x+y, 2x — 2y)". 


Para vetores na base canônica C, a matriz de T é 


(1,0) pb =5-1,1/2)" (porque (1,0) = —1(0,1)! + 1/2(2,2)") 
((0,0)p = (1,0)! (porque (0,1) = 1 (0, 1)" + 0(2,2)") 


As matrizes de mudança são, portanto: 


A matriz que realiza a transformação na base D é 


B= TosD == lid]e DÍTle sclidlp +C 


4.3. PROPRIEDADES DE MATRIZES DE TRANSFORMAÇÕES 137 


= SAST!, 
e portanto as matrizes A = [T]c—c e B = [Tlb-,p são similares. A matriz B é 
— _{ù{—3 —4 
B=[Tloso = P 3) 


Para finalizar este exemplo, tomamos as coordenadas um vetor qualquer em R? na base canônica, v — 
(3,5)T. Calculamos w = T(v) nas duas bases. Temos 


Mese(lvlc) = É E (3) F E = [wc 


Para aplicar T na base D, primeiro obtemos as coordenadas [v]p: 


E -(1WN/3)0[2 
[vlo = lidlesplvlc = bi ) (3) = NA . 
Agora aplicamos [Tlbsp: 


Mo-o(lvlD) = (y E h = A 12) = [wp. 


Agora verificamos que este é de fato o mesmo vetor w na base D: 


—12 (0 )44 (215 8). < 
(3) É E 
A proposição a seguir segue trivialmente do fato de matrizes similares representarem a mesma trans- 
formação. 
Proposição 4.60. Matrizes equivalentes (ou similares) tem o mesmo posto. 


Teorema 4.61. Similaridade é uma relação e equivalência. 
Demonstração. Demonstramos a reflexividade, simetria e transitividade a seguir. 
(i, reflexividade) A é similar a A, trivialmente: ZATT! = A 
(ii, simetria) Suponha que A é similar a B. Então 
A =SBS7! 
AS =SBS!S 
AS = SB 
STAS =B 
(iii, transitividade) Suponha que A é similar a B e B é similar a C: 
A =SBS7! 
B =RCR!. 
Então 
A = SBS! 
= SRCRT IST] 
= (SRJC(SR) |. E 


138 CAPÍTULO 4. MATRIZES E TRANSFORMAÇÕES LINEARES 
Exemplo 4.62. Sejam 


f 3 _[{2 o0 a AO 
A=() 3): P=(2 18): j =( E. 


Exemplificamos primeiro a simetria. Suponha que B é similar a A, com 


B = PAP™!. 


(d DD- 
0 1⁄3) 2 —1 0 —3 1/3. 1)" 


Como temos B = PAP-!, temos também A = P7! BP: 


aipa A2 0 Mais 2 ONT dl 
g sP = ( 0 3 (ams r3) ( 0 „=G $) =A 


Agora ilustramos a transitividade. Suponha que 


Ne 1.0. [—1 0 
R=( 0 9), j -( 0 o 


e C é similar a B, com C = RBR- !: 


cA Yas 1) 1) = las 4) 
o 4) (1/33 1} \ 0 1/4 4/33 1)” 


Temos C similar a B e B similar a A. Devemos ter, portanto, C similar a A. 


Então 


C = RBR! 
=R(PAP RT! 
= (RP)A(PT' RT!) 


=(4 UR 13) 4 (RO) 0a 14) 
04 0 1/3 03 0 1/4 
h2 o0 12 0 
-( a) de ( 0 o 

Naa m— 

RP PI R-I=(RP)- 


Claramente, RP e P!R”! são inversas, e portanto C é similar a A. « 


4.4 Espaços de transformações 


Uma transformação de um espaço de n dimensões em outro, de m dimensões, sempre será representada 
por uma matriz m x n. Já verificamos que dados m e n, o conjunto de todas as matrizes m x n é um 
espaço vetorial. Podemos dizer então que o espaço Mmxn é o espaço das transformações de dimensão n 
para dimensão m. 
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Exemplo 4.63. Uma matriz 3 x 2 representa uma transformação de R? em R?. Mas sabemos também que 
as matrizes 3 x 2, com as operações de soma de matriz e multiplicação por escalar, é um espaço vetorial 
(M3x2). Esse espaço é, portanto, isomorfo ao espaço de todas as transformações lineares de R? emR?. « 


Exemplo 4.64. É particularmente importante o espaço dual de um espaço vetorial. 


Definição 4.65 (Espaço dual). Seja V um espaço vetorial sobre um corpo F. O conjunto de todas as trans- 
formações lineares de V em F é o espaço dual de V, denotado por V*. + 


Suponha por exemplo que V = RÌ. Então V* é o conjunto das transformações de R? em R, que 
podem ser representadas por vetores-linha com 3 elementos (e portanto tem a mesma dimensão que R3: 
dim V* = 3). 

A matriz (vetor-linha) (2, 0, 3) pertence a (Rº)*, porque representa uma transformação de R? em R. 

< 


4.5 Matrizes elementares 


As operações elementares utilizadas na solução de sistemas lineares pelo método de eliminação de Gauss] 
são transformações lineares, e suas matrizes são chamadas de matrizes elementares. Uma matriz elementar 
é obtida aplicando uma operação elementar em Z. 


Definição 4.66. Uma matriz elementar é uma matriz obtida submetendo Z a uma das seguintes operações 
elementares: 


* Multiplicação de uma linha i por uma constante k, denotada Eri; 
* Permutação de duas linhas i e j, representada por E; ;; 
* Soma de um múltiplo de uma linha a outra linha, denotada E; (wr;)- + 


Exemplo 4.67. A operação de multiplicação da segunda linha por 5 é uma operação elementar. Seu efeito 
na matriz identidade 4 x 4 é mostrado a seguir. 


1000 
05 00 
0010 
0001 
Temos então 
1000 12 1-1 1 2 1 —] 
0500 23 1 4/-|10 15 5 20). « 
0010 95 —6 7 9 5 6 7 
0001 —13 1 2 —1 3 1 2 


Exemplo 4.68. Permutar a segunda e terceira linhas é uma operação elementar. O efeito na identidade 


3 x 3 é mostrado a seguir. 
100 
001 


01 0 
20 método de eliminação de Gauss é descrito na seção[oc.1.2]do Apêndice[od 
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100)/2-12 2 -12 
001 O 11/13 4 5): < 
010/43 45 O 


Exemplo 4.69. Somar 4 vezes a primeira linha à terceira é uma operação elementar. O efeito na identidade 


3 x 3 é mostrado a seguir. 
100 
010 


4 0 1 


1 00\/12 3 TOE a 
O10O)|921 1)=|9 1 —I ja < 
4 0 1 2 6 12 6 14 24 


O teorema a seguir esclarece a atuação de matrizes elementares sobre outras matrizes. 


Por exemplo, 


Exemplificando, 


Teorema 4.70. Seja A uma matriz quadrada. Então, com relação à multiplicação de matrizes elementares à es- 
querda de A: 


i) EiA resulta na matriz A com as linhas i e j trocadas; 
ii) EkriA resulta na matriz A com a i-ésima linha multiplicada por k; 


iii) EipkijA resulta na matriz A após a soma de k vezes a j-ésima linha sobre a i-ésima. 


Já com relação à multiplicação de matrizes elementares à direita de A, temos: 
i) AE; resulta na matriz A com as colunas i e j trocadas; 
ii) AEirx resulta na matriz A com a j-ésima coluna multiplicada por k; 
iii) AE;,xr; resulta na matriz A após a soma de k vezes a i-ésima coluna sobre a j-ésima. 


No Teorema observe que os itens (iii) das duas situações não diferem apenas na atuação de linhas 
e colunas, mas nos índices também: Denotarmos a k-ésima linha e a k-ésima coluna por Ly e Cg. A mesma 
matriz elementar E;(w,) soma: 


* œ vezesaj-ésima linha à i-ésima; 
* a vezes a i-ésima coluna à j-ésima. 
Note a troca de índices: 
Li S Li + alj 
Cj = Cj + «Ci; 


Exemplo 4.71. Temos a seguir três matrizes elementares de ordem 3: 


100 300 100 
E235 (0 01), Esmi=|01 0]; E»6r3=ļ0 1 5l. 
010 001 001 
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Escolhemos também uma matriz quadrada para observar a atuação das matrizes acima: 


1—1 0 
A=| 4 22]: 
-5 73 


A seguir temos a atuação das matrizes Ex à esquerda de A: 


1-1 0 3 —3 0 1-1 0 
E23A=[05 73), Dune 4 22), EzsrA=|-2 37 17). 


A. 5 aÃ) -5 7 3 
Agora verificamos a atuação das matrizes Ex à direita de A: 
1 Paz ar o0 1 —1 8 
nue EESE 22). amo=( 4 20). « 
-5 EM si 7 3 -5 7H 


Definição 4.72 (Matrizes equivalentes por linhas). Duas matrizes A e B são equivalentes por linhas se uma 
pode ser obtida da outra por operações elementares em linhas. Ou, equivalentemente, se 


A = EkEk—1 -+ EB, 


onde cada E, é uma matriz elementar. 4, 


Ases) G a 


A e B são equivalentes por linha, porque 


a=( 2 1) L2+3 ( 2 E L2+L1ı (2 1)=8 
—6 9 —2 3 04 


A e C também são equivalentes por linhas, porque 


ad = 2 1) b 2 N Hol, f2 3] 
(2 1) —2 3 2a zN i e 


Teorema 4.74. Equivalência por linhas é uma relação de equivalência. 


Exemplo 4.73. Sejam 


Demonstração. Precisamos mostrar reflexividade, simetria e transitividade. 
(i) (Reflexividade) Trivial (A é equivalente a A - a sequência vazia de operações elementares transforma 
AemaA). 
(ii) (Simetria) Se A é equivalente por linhas a B, há uma sequência de matrizes elementares E4, E»,..., 
Ex tal que B = E, Es... ELA. Como toda matriz elementar tem inversa, temos A = Es! Ert te Er. B. 
(iii) (Transitividade) Se A é equivalente por linhas a B e B é equivalente por linhas a C, então 
A = EkEk—1 ...E1B 
B AEk i sec EC: 
Mas então 


A = (EkEk-1 ...E1)B 
= Eder -s Er) (EnEn ETC E 


m—l 
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4.6 Sistemas de equações lineares 


Podemos representar um sistema de equações lineares em forma matricial. O sistema a seguir tem m 
equações en variáveis. 


a11X1 +Haxz+...+ anxn=b 


a21X1 + d22Xx2 +... + donXn = b2 


am1X1 + Am2X2 +... + AmnXn = bn 


Este sistema é descrito por uma matriz A, onde cada entrada aij é o coeficiente da j-ésima variável na 
i-ésima linha; um vetor coluna x, com cada uma das variáveis, e um vetor coluna b com os valores do lado 
direito das equações: 

Ax =b. 


E desta forma resolver o sistema é o mesmo que encontrar o vetor x que satisfaça esta equação. 


Exemplo 4.75. O sistema 
xı —2x2 +3x3 =4 
5x2 —X3 +3x4 =2 
xı +x2 +x, x4, =10 


1-2 3 [X 4 
(o 5—1 ) a -(2). « 
1 1 1 4KS 10 


É claramente possível também representar sistemas de inequações como Ax < b ou Ax > b. 


é descrito como 


Definição 4.76 (Sistema linear homogêneo). Um sistema de equações lineares é homogêneo se é da forma 
Ax = 0 (ou seja, se os termos independentes de todas as equações são iguais a zero). + 


Exemplo 4.77. O sistema a seguir é homogêneo. 


E) i 


Todo sistema linear homogêneo admite pelo menos uma solução, com todas as variáveis iguais a zero. 
Esta solução é chamada de solução trivial para o sistema. O sistema dado como exemplo admite a solução 
trivialxı = x2 = 0. É importante ressaltar que isto significa que um sistema homogêneo sempre é possível 
(ou “compatível”), mas ele pode ter infinitas soluções (quando é indeterminado) ou somente uma (quando 
é determinado). 

(0) Teoremaļ4.78]reafirma o que dissemos no exemplo[1.58] no Capítulof1] Damos aqui uma demonstração 
diferente, usando notação matricial. 


Teorema 4.78. O conjunto de soluções para qualquer sistema homogêneo de equações lineares é um espaço vetorial. 


Demonstração. As soluções são claramente um subconjunto de R” (ou K” para algum corpo K), portanto 
somente precisamos provar que é subespaço de R”. 
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i) O vetor zero pertence ao conjunto, porque O é solução. 
ii) A multiplicação de uma solução por escalar resulta em outra solução: 


c(Ax) =c-0 
A(cx) = 0 


E portanto cx é solução. 


iii) A soma de duas soluções também resulta em outra. 


Ax= Ay =0 
Ax+ Ay =0 
Alx+y) = 0 
E portanto x + y é solução. E 


Antes de enunciar o próximo Teorema, relembramos a classificação de sistemas lineareg)] que um sis- 
tema pode ser impossível, possível e indeterminado (com infinitas soluções) ou possível e determinado (com 
somente uma solução. 


Teorema 4.79. Um sistema linear Ax = b é determinado se e somente se A tem inversa. 


Demonstração. Temos 


Ax=b 
AT'Ax =A 'b 
x= Ab. 


(=) Como a inversa é única, sua existência garante que existe uma única solução para o sistema. 

(&) A existência de uma solução única também nos permite determinar AT !. Se o sistema não tem solu- 
ção, a inversa não pode existir. Se o sistema é indeterminado, há mais de um x que o satisfaz, e portanto 
A não pode ter uma única inversa. Não podendo haver uma única inversa, concluímos que a inversa não 
existe. E 


Exemplo 4.80. O sistema 


X1 —X3 = 3 
xı +3x2 —x3 = —6 
X1 —2x3 = — 


pode ser reescrito na forma matricial como 


A inversa da matriz de coeficientes A é 


t 2 0 — 
Av = | -1/3 1/3 0], 
1 0 —1 


*Esta classificação é dada na Definição[e.4] no Apêndice[od 
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e a solução para o sistema é 


x=A!b 


2 0-1 3 
—1/3 1⁄3 0ļ|—6 
1 Que 


I 

| 
AWN 
Sei 


Exemplo 4.81. Mudando um único coeficiente no sistema linear do exemplo obtemos 


X] —x3 = 3 
x1 +3x2 —x3 = —6 
X1 —x; = +— 


que podemos descrever na forma matricial como 


A matriz de coeficientes não tem inversa, e o sistema não tem solução única (na verdade não tem solução 
nenhuma). 
Mesmo que troquemos o vetor b para qualquer outro vetor não-nulo, continuaremos sem solução única. Observe 


que se mudarmos b para 
3 
b= —6 |> 
3 


a primeira e a terceira linhas do sistema passam a ser iguais: Ax = b seria o mesmo que 


1 0 — X1 3 
1.3 —1 x2 |5 |—6]> 
1 0 —1 X3 3 


e teríamos então infinitas soluções da forma 
xı =xX3 +3, X2 =—3, 
mas não teríamos uma única solução. < 
Uma matriz está na forma escalonada se representa um sistema linear escalonado. 


Definição 4.82 (Matriz escalonada por linhas e por colunas). Seja A uma matriz. Se as condições (i) e (ii) 
abaixo valem para todas as linhas adjacentes i e j (com i + 1 = j), então dizemos que A está na forma 
escalonada por linhas. 


i) Sej não é nula, i também não é; 


4.6. SISTEMAS DE EQUAÇÕES LINEARES 145 


ii) A quantidade de zeros à esquerda do primeiro elemento não-nulo em i é estritamente menor que a 
quantidade de zeros à esquerda do primeiro elemento não-nulo em 5. 


O pivô de uma linha é o primeiro (mais à esquerda) elemento não-nulo. 

Se todo pivô da matriz for igual a um e as colunas dos pivôs não tiverem outras entradas não-nulas, a 
matriz está na forma escalonada reduzida por linhas. 

Uma matriz está na forma escalonada (reduzida) por colunas se sua transposta está na forma escalonada 
(reduzida) por linhas. + 


Exemplo 4.83. Todas as matrizes mostradas a seguir estão na forma escalonada. 


13 11 7 
369 1 —1 2 
001 0 00 0 02 0009 
0 00 
Exemplo 4.84. Todas as matrizes mostradas as seguir estão na forma escalonada reduzida por linhas. 
150 102 1000 
A=|o 0 1f} B=ļ|o0o 13) CW 1038 4 
000 000 0019 


Observe que se À é a matriz aumentada de um sistema linear, a forma escalonada reduzida por linhas 
identifica claramente a solução. Por exemplo, na matriz B do Exemplo[4.84] temos xı = 2, x2 =3,ea 
linha adicional não faz diferença. Já na matriz C, temos xı = 0, x2 = 8e x3 = 9. 

Claramente, a forma escalonada por colunas é obtida usando as mesmas operações que resultam na 
forma escalonada por linhas, exceto que as operações são realizadas na transposta (ou seja, são realizadas 
nas colunas e não nas linhas). 


Exemplo 4.85. Todas as matrizes mostradas as seguir estão na forma escalonada por colunas. 


2000 
200 -5 0 0 
a=(3 40) s=(70 4 0) c= S « 
Exemplo 4.86. Todas as matrizes mostradas as seguir estão na forma escalonada reduzida por colunas. 
100 
100 100 
a=(a 10] s=(2 06) c-[0 16 « 
020 010 2309 


4.6.1 Eliminação de Gauss 


Nesta seção revemos o método da eliminação de Gauss para resolução de sistemas de equações lineares 
usando matrizes elementares. 


Definição 4.87 (Matriz aumentada). Seja Ax = b um sistema de equações lineares com m equações e n 
variáveis. Então a matriz aumentada deste sistema é a matriz m x n + 1 que tem as colunas de A seguidas 


da única coluna de b, 
A | v) ; + 
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Exemplo 4.88. O sistema linear 


é descrito em forma matricial como 


A matriz aumentada do sistema é 
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2x1 + 3x2 — x3=2 
= 1 
—x1— X2 + 8x3 =4 


3x1 — X2 


2 3 N [x 2 
3-1 0)|x|=[1 
1—1 8 lx 4 

2.3 -1'2 

3 -0:1 

—1 =1, 84 


< 


A solução de sistemas triangulares (na forma escalonada) pode ser feita na forma matricial da mesma 
maneira que quando é usada a representação sem matrizes. O processo de eliminação de Gauss consiste 
na aplicação sucessiva de operações elementares sobre o sistema linear. Quando representamos o sistema 
como matriz aumentada, cada aplicação de operação elementar é uma multiplicação. O processo de elimi- 
nação de Gauss consiste em multiplicar sucessivamente a matriz aumentada por matrizes elementares. 

Lembramos aqui que normalmente não realizamos operações elementares sem ordem definida. Em 
cada fase do algoritmo, transformamos em zero a parte inferior de uma das colunas da matriz, processando 
as colunas da esquerda para a direita. A seguir temos um exemplo para um sistema com 3 variáveis e 4 
equações (que resulta em uma matriz quadrada de ordem 4). Os pivôs estão marcados com fundo cinza. 
Para simplificar a exposição, não ilustramos trocas de linhas. 


a13 
a23 
a33 
a43 


a44 


FASE 1 
Q11 : Q12 Q13 Q14 aı 
a21 |! a22 a23 a24 | , | az 
031; 032 033 Q34 0 
O i a42 a43 as 0 
Q11 : Q12 : Q13 Q14 a11 
O į a22; az a4 ļ| ,| 0 
0: O i a33 a34 0 
O i O i d43 a44 0 


Exemplo 4.89. Considere o sistema a seguir. 


Este sistema pode ser representado por 


2x1 — X2 +4x3 =9 
=4 


—x1 +4x2 — x3 = 


XxX — X2 


2—1 49 
1—1 0i4 
= 41i] 


ooo 
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Aplicamos operações elementares até chegar a uma matriz triangular superior: 


1—1 0/4 1 -10; 4 0 —1/2 


2 =] 0 à) Es41,211 2 + 4| ? E2—1/211 2 = 
Riad dim 


1 4 11 0 7/2 1111/2 0 7/2 


2 —1 4 | 2 E1,,211,E-212,E- 1/1313 | —1/2 2 2/2 
0 —1/2 —2:;-—1/2 "o 14: 1 
0 Ds 2 0 0 1:-2/13 
E substituindo as variáveis obtemos o resultado 
KI = 73/13, 
x2 = 21/13, 
x3 = —2/13. 


Cada uma das operações é uma multiplicação por matriz elementar. Por exemplo, a primeira operação é 


1 00A / 2-149 2 -14i 9 
0O 10 1—1 04|5|11 ~1 O! 4 
1/2 0 1/ 1 4 —1:1 0 7/2 1:11/2 


O Exercício|111|pede as outras matrizes usadas. 


Cálculo da inversa 


Podemos calcular a inversa de uma matriz usando operações elementares. 


Método 4.90. Escreva a matriz lado a lado com a identidade. 


a11 A12 =... UM 1 (0) oO) 
a21 Q22 A2n 0 1 : 
Ami Am2 --. Am O .A LJ. 1 


Realize operações elementares na matriz do lado esquerdo até transformá-la na identidade. Cada operação 


que realizar no lado esquerdo, realize também na matriz do lado direito. 


071 a12 +... Aln 1 0 PEE 0) 
a21 Q22 a2n 0 1 
Ami Am2 ... Amn à RR 
$ 
E, 
E2 
Ek 
l 
1 0 .. 29 bm biz ... bm 
01 j 


b21 b22 ban 


0 E a sexos 1 bmi bmz ... bmn 
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Ao terminar, a matriz à direita será B = AT !. (J 


2 14 
As dio 1of. 

0 —5 6 
2-1 4 mo 
o 10|]lo1o 
0 —5 6/40 0 1 


Somamos 5 vezes L em Ls, depois dividimos Ls por 6: 


2 -14 1 0 0 
o 10 0 1 0 
0 01 O 5/6 1/6 
204 1 1 0 
010 0 1 0 
0 0 1/ \0 5/6 1/6 


2 0 0\ [1 -7⁄3 -2⁄3 
0 1 0]ļo 1 0 


001 0 5/6 1/6 


Exemplo 4.91. Inverteremos a matriz 


Começamos escrevendo Z ao lado de A: 


Somamos L2 a Ly: 


Somamos —4L3 a Ly: 


Finalmente, dividimos L; por 2: 


0 1 0 


e 0 ) 1/2 —7/6 —1/3 
O 5/6 1/6 


A matriz à direita é a inversa de A: 


2 1,4 71/2 —7/6 —1/3 100 
O 10 0 1 ol=|010 «4 
o 01 O 5/6 1/6 001 


Este método pode ser útil se quisermos resolver mais de um sistema com os mesmos coeficientes. 
O exercício 109/pede a demonstração do teorema a seguir, que enuncia a corretude do método. 


Teorema 4.92. O método[4.90|sempre produzirá a inversa de qualquer matriz não singular. 


4.6.2 Decomposição LU 


Definição 4.93 (Decomposição LU). Seja A uma matriz quadrada. Se existem L e U tais que U é triangular 
superior, L é triangular inferior, e A = LU, então LU é a decomposição LU de A. 

Se a diagonal de L só contém uns, esta é a decomposição de Doolitle. Se a diagonal de U só contém uns, é 
a decomposição de Crout + 
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Exemplo 4.94. Seja 


Temos 


= Oia 
eia x o) ç r ü 


Teorema 4.95. Seja A uma matriz quadrada tal que 
EkEk 1... EA =U, 


onde as matrizes E; são elementares que não realizam trocas de linhas, e U é diagonal superior (ou seja, A pode ser 
escalonada sem trocas de linhas). Então A admite fatoração LU. 


Demonstração. Suponha que A necessite de k passos para ser escalonada. Realizamos o escalonamento de 
A, mas descrevendo-a inicialmente como 
A = TA. 


Observe que a matriz identidade, Z, é triangular inferior. Aplicaremos operações elementares em A até 
transformá-la em U, escalonada, e consequentemente triangular superior. A aplicação destas operações 
modificará a matriz identidade, à esquerda, mas ela será mantida triangular inferior durante todo o pro- 
cesso. 


ATA 
=XVA (E&A =A0)) 
USA (2) (E2E1A = AlZ)) 
= xK) 
= Xu. 


Se realizarmos operações elementares somente em Ati), para que a multiplicação X A® continue sendo 
igual a A, teremos que multiplicar X!) pela matriz elementar inversa - e multiplicaremos à direita de X): 


(xDE-D (4/0) 
= xt) ( EE Jal) 
Se 
=XUZTAM =A. 


Olhamos para o efeito das duas operações elementares. Suponha que pivô atual é o da j-ésima coluna Y;;, 
e que pretendemos modificar a i-ésima linha, com i > j (ou seja, uma linha abaixo do pivô). 


* E realizará uma modificação na linha i, mas somente os elementos depois (abaixo) da posição j serão 
modificados (os anteriores eram zero). 


e E`! realizará uma modificação na coluna i, mas somente os elementos antes (à esquerda) da posição 
j serão modificados (os da direita eram zero). 
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Assim, a aplicação das duas operações não desfaz a parte escalonada por linhas de X(i), e nem a parte 
escalonada por colunas de Al. O resultado será 
A = LU, 
onde L = X"), triangular inferior,e U = A(X), triangular superior. E 
A demonstração do teorema[4.95Jnos dá um método para encontrar a decomposição LU de uma matriz. 


Método 4.96 (Decomposição LU). Descreva A como ZA. 


1 0 0 Q11 Q12 >t Ain 
A= 0 1 0 azı a22 a2n 

: 0 : i 

0 1 üni e: Ann 


Use o método da eliminação de Gauss transformar a matriz da direita em triangular superior, escalonando- 
a, mas sempre que aplicar a operação elementar nas linhas da matriz à direita, aplique sua inversa nas 
colunas da matriz à esquerda. Quando a matriz à direita estiver escalonada, a da esquerda será triangular 
inferior. º 


Exemplo 4.97. Obteremos a decomposição LU da matriz 


23 + 
2 1 3p 
4 0 7 


Durante o processo, mostraremos tanto L como U. Denotamos por U; a i-ésima linha de U. Começamos 
com À = ZA. 


L u 
— Aaaa amam 


— 

(o oG ds) seus do) (o -2 e) 

Pedorollz K5)|—— GAI 1 ollo -2 6 

001 MW 7 001/4 0 7 

UsUs-2U, É 0 ) É 3 3) UsUs-3U> É 0 o) o 3 3) 

E + - 1 ollo -2 cel liTOollo-z 6 « 
0 1/40 -6 9 231/\0 0 


1 
2 

Se uma matriz A precisa de permutação de linhas para ser escalonada, não admite decomposição LU. 

Podemos, no entanto, decompô-la de forma parecida com a decomposição LU. 


Teorema 4.98. Toda matriz quadrada A pode ser decomposta em A = PLU, onde P é uma matriz de permutação; 
L é triangular inferior; e U é triangular superior. 


Demonstração. Se aplicarmos o método de decomposição LU que descrevemos, mas permitirmos trocas de 
linhas, também trocaremos as colunas da matriz da esquerda, e por isso ela pode não terminar o processo 
como triangular inferior. 

No entanto, estas trocas podem ser representadas por uma matriz de de permutação P. Ao invés de 
manter duas matrizes, iniciando com Za, mantemos três matrizes, começando com TTA: 


A=TIA 
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=POxXDAM (EA = Al) 
= Px BA) (E2E1A = A(2Z)) 
= pixa 

= PXU, 


Quando uma operação de troca de linha for aplicada em AÍ», as colunas de X(“ ficarão na ordem errada. 
Aplicamos uma troca de linhas em X{® e sua inversa nas colunas de Pt) 


PO raExO 


Desta forma mantemos X como triangular inferior. Durante todo o processo P será matriz de permutação, 
e ao final teremos 


A = PLU. E 
Exemplo 4.99. Considere a matriz 
O 41 4 
1 21 1/2 
12 24 6 1 
2 -8 5 7/6 


Esta matriz não pode ser escalonada sem troca de linhas. O processo para deixá-la na forma triangular de- 
verá necessariamente trocar as duas primeiras linhas de ordem, já que não é possível dividir pelo elemento 
qa =Q. 

Começamos com À = TTA. 


1000\/f000 O 41 4 
a=-ļlo0100ļ|ļo100ļ|]| 1 2 11⁄2 
0010]{0010]({12 24 6 1 
0007110001 2 -8 5 7/6 
C16C3 LioLs 
1000\/0010\/2 246 1 
=toToaDlo 100 t 2 1 1/12 
00 10]{1000 0 41 4 
00:00 1 AD 0003 2 -8 5 7/6 
C1C3 PAR Na 
0010 a O 12 24 6 1 
{01 00|ļ0100 1 2 1 1/12 
1 000]l0010 0 41 4 
OD o 1/ Ao Nó 1 2 -8 5 7/6 
Cı=C1+C2/12 L2=L2—L1/12 
C1=C1+C4/6 La=L4—L,/6 
0010 1000 2 24 6 1 
-|010%6 1/12 100 0 01/20 
1000 0010 O 4 14 
0001 1/6 0 0 1 0 —12 41 
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RE rd LoóLs 
0010 RE EE 0 0 ; 12 24 6 1 
0100 1/12 0 : 0 4 14 
1000 01 O 01/20 
0001 1/6 0 o i 0 —12 4 1 
P a Ra 
EEE 100 T roo oF 12 24 6 1 
= OD O 0 4 14 
1000 in : i $ (0) 0 1⁄2 0 
0001 1/6 0 01 0 —12 41 
ORK cec T L4=L4+3L2 
0100 EE TAA 0 0 12 24 6 1 
{0010 100 0 4 1 4 
1000 1 010 0 01⁄2 0 
0001 1/6 —3 0 1 0 0 7 13 
aA OHA C3+14C4 L4=L4—14L3 
0100 NY o o o 0 0 A2 24 6 1 
-|0010 1 00 0O 4 1 4 
1000 Xi 0 10 0o 0 1⁄2 0 
0001 1/6 —3 14 1 0 0 0 13 


Temos finalmente A = PLU, onde P é matriz de permutação, L é triangular inferior e U é triangular 
superior. < 


Teorema 4.100. Se uma matriz admite decomposição LU, também pode ser decomposta em LDU, onde L é trian- 
gular estritamente inferior, U é triangular estritamente superior, e D é uma matriz diagonal. 


Resolução de múltiplos sistemas lineares via decomposição LU 
Passamos agora ao uso da decomposição LU na solução de sistemas lineares. 


Método 4.101 (Resolução de sistemas lineares por decomposição LU). Suponha que queiramos resolver o 
sistema Ax = b. Se A tem fatoração LU, podemos usar o método a seguir. 


* Decomponha A em LU. Agora temos LUx = b 

* Seja y = Ux. Resolvemos Ly = b 

* Como L é triangular, o sistema é resolvido facilmente e obtemos y. 

* Finalmente resolvemos Ux = y, que também é fácil porque U é triangular, e obtemos x. o 


Suponha que queiramos resolver diversos sistemas com a mesma matriz A, mas com diferentes vetores 
constantes b1, b2, etc. Podemos calcular a fatoração LU de A (que é a parte mais demorada do processo) 
e posteriormente resolver LUx = b; facilmente. Por esse motivo o método LU é normalmente preferível 
à eliminação de Gauss. 


Exemplo 4.102. Suponha que queiramos resolver os sistemas 


(i) Ax =b, 
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(ii) Ax’ =c, 
(ii) Ax” =d, 


1 2 —1 1 0 
A=| 26 -3), b=[ 1], c=|0), d 

—2 2 4 10 15 

Primeiro calculamos a decomposição LU de A: 
1 0 0A% — 
A=| 21 oļ|o2 -1)]- 

—2 3 1 \0 0 5 

Esta decomposição, que requer muito trabalho, é feita uma única vez. Agora resolvemos os tres sistemas por 


simples substituição. 
(i) Resolvemos Ax = b, ou LUx = b. Seja w = Ux. Resolvemos Lw = b facilmente, porque L é 


triangular: 
10 0) [Wi 1 
210 w] =|] 
-2 3 1/ \w; 10 


W1 = 1, wz=—], w3 = 15. 


onde 


E: 


Temos 


Agora resolvemos Ux = w, também facilmente, porque U é triangular: 
1 2 —1 X1 1 
02 —1 x2 | =| +—1 
00 57 Ax3 15 


x A2, x =l, x3=8, 


Obtemos 


(ii) resolvemos Ax’ = c, ou LUx’ = c. Seja y = Ux”. Resolvemos Ly = c facilmente, porque L é 


triangular: 
10 0) [Ui 0 
210 vz] =| 0 
=2::3> 14 Wys 15 


yı =0, y2=0, y3 = 15. 


Temos evidentemente 


Agora resolvemos Ux” = y, também facilmente, porque U é triangular: 


ONA /* 0 
0 2 —1]{|x]={ 0 
00 5 dx! 15 


x1 =0, xj =3/2, x4 =3. 


Obtemos 
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(iii) Novamente, resolvemos Ax” = c, ou LUx” = c. Seja z = Ux”. Resolvemos Lz = c facilmente, 
porque L é triangular: 


Temos 
zı =4, z2 =—6, z3 =6. 


Agora resolvemos Ux” = z, também facilmente, porque U é triangular: 
12 NA 4 
o 2 1] |x)|=|-6 
O 00 5/ Way 6 


xy =10, xý =-12/5, x} = 6/5. « 


Obtemos 


Como já vimos, a matriz A pode não admitir decomposição LU. Neste caso calculamos a decomposição 
PLU de A e usamos o método abaixo. 


Método 4.103 (Resolução de sistemas lineares por decomposição PLU). Suponha que queiramos resolver 
o sistema Ax = b. Se A não tem fatoração LU, podemos usar o método a seguir. 


* Decomponha A em PA = LU. Agora temos PLU = Pb. 

* Permute os elementos de b - ou seja, calcule d = Pb 

* Sejay = Ux. Resolvemos Ly = d 

* Como L é triangular, o sistema é resolvido facilmente e obtemos y. 


* Finalmente resolvemos Ux = y, que também é fácil porque U é triangular, e obtemos x. o 


4.6.3 Estabilidade numérica 


A resolução de sistemas lineares envolve repetidos passos de computação numérica, e isso normalmente 
resulta em erros de arredondamento que tornam-se maiores no decorrer do processo. Dizemos que estes 
algoritmos tem um problema de estabilidade numérica. Uma maneira de mitigar este problema é tentar 
evitar divisões por números muito pequenos, através de permutação de linhas ou multiplicando linhas 
com coeficientes pequenos por constantes grandes. Mais detalhes sobre métodos para computar soluções 
para sistemas lineates podem ser obtidos na literatura de Cálculo Numérico - por exemplo, no livro de 


Neide Franco [Frao7). 


4.7 Matrizes complexas 


Podemos também representar transformações lineares em espaços vetoriais sobre corpos complexos, sendo 
portanto útil conhecer um pouco da álgebra das matrizes complexas. 
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Exemplo 4.104. A matriz 


representa uma transformação linear. 

Se o domínio for R2, temos T : R2 — C?, 

Se o domínio for C2, temos T : C? > C2, 

Se o domínio for a reta X composta pelos pontos (3x, ix), com x € R, mesmo tendo domínio complexo, 
a transformação é 

T(x,3x)! = (—i(3x) +3(ix),3x + 2x)! = (0,3x + 2x)", 

e a imagem de T está contida em R?, logo poderíamos definir R? como contradomínio, e teríamos T : X — 
R2, « 
Definição 4.105. Se A é uma matriz complexa, A é a matriz dos conjugados de A, que contém os conjugados 
complexos dos elementos de A. + 


Exemplo 4.106. Sejam 


A=]! 2 B.— io Geri 2-1). 
(3 |! j E ) iv2 1+v3 
A s/l Ja B=-=[-1 0 Tae p= q 
K -0 ' ( i o) A fava È 


Definição 4.107 (Conjugado transposto). O conjugado transposto, ou a matriz adjunta de uma matriz A é a 
transposta da matriz com os conjugados dos elementos de A: 


Então 


AMIDA , 
Também é usada a notação A*. + 


Observe que se A somente tem elementos reais, então AH = AT, 


2—3i 5 i 
A= —i 0 1 
0 1+2i 1—i 


á 2+3 à 0 

A = 5 0 1-2 4 
—- 1 1+i 

Teorema 4.109. Sejam A e B matrizes complexas m x n, e z um número complexo. Então 


i) (AMH=A 


Exemplo 4.108. Seja 


Então 


i) (zA)H = 2(AM) 
ii) (A+B)H=AH+BH 
iv) (AB)H = BHAH 


v) Se A tem inversa, (A D)H = (AH) 
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4.8 Aplicações 


4.81 Cálculo de uma única coluna da inversa [ decomposição LU | 


Se quisermos calcular somente uma coluna da inversa de uma matriz A, podemos obter sua fatoração LU 
e usar a matriz U para obter a coluna desejada. Para isto basta usar substituição: 


Ux = e; 


nos dará a i-ésima coluna da inversa. 
Por exemplo, 


1 CN (1 2 3 
A=0 Volto 4 5 
1 —1/2 1/ \0 0 12 


Usamos somente a matriz U para computar, por exemplo, a terceira coluna de A”. Resolvemos 
1Y 3 X1 0 
04 5 x2 1 = 10 
0 0 —1/2/ \x 1 


X1 =1 
x2=5/2 


x3 = —2 


e obtemos 


ou seja, a terceira coluna da inversa de A deve ser 


1 
5/2 
— 


De fato, a inversa de A é 


0 0 1 
-5/23/2 5/2 
aI -2 


Este método requer menos esforço do que computar a inversa completamente. 


4.8.2 Otimização linear [ base; espaço-coluna; dimensão; fatoração LU ] 


Nesta seção introduzimos conceitos de otimização linear a partir de um exemplo. 
Uma indústria fabrica tintas de dois tipos, A e B. Queremos saber quanto de cada tinta pode ser fabricado 
a fim de maximizar o lucro da empresa, levando em consideração as seguintes restrições: 
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i) Cada lote do tipo A tem, para a empresa, um custo de 4, e cada galão do tipo B custa 3, e o orçamento 
da empresa prevê que se gaste até 20 com a produção das tintas por semana. O lucro para um litro 
da tinta do tipo A é de 5, e para um do tipo B é 10. 


ii) Três lotes da tinta A demoram 3h para serem produzidos, enquanto a mesma quantidade da tinta B 
demora 10h. A empresa tem 40 horas úteis disponíeis para a produção em uma semana 


iii) A tinta A só é produzida por um fornecedor, que só oferece quatro lotes por semana, no máximo. 


Estas são as restrições do problema. Chamamos de xı a quantidade de tinta do tipo A e x2 a quantidade de 
tinta do tipo B. Queremos portanto maximizar o lucro, 


z=5x + 10x2. (4.5) 
Esta é a função objetivo que queremos otimizar. 
Definição 4.110 (problema de programação linear). Em um problema de programação linear, temos um 


conjunto de pontos definido por desigualdades ou igualdades lineareg'] e que podemos descrever como o 
conjunto de soluções de um sistema 


Ax=b. 


Chamamos este conjunto de pontos de região viável. 
Dentro da região viável, queremos encontrar o ponto x* que maximiza o valor de uma função linear 


f(x) = C1X1 EX2 +--+ CnXà 


= clx. 


Assim, um problema de programação linear pode ser descrito como 
En T 
maxımıze cC X 
sujeito a Ax = b, 


x>0. + 


No problema que estamos modelando, as restrições que temos são: 


4x] “1 3x2 < 20 (1) 
3x + 10x2 < 40 (ii) (4.6) 
X1 < 4 (iii) 


além, é claro, de x > 0, uma vez que não faz sentido produzir quantidade negativa de tinta. 
Temos portanto m restrições na forma de desigualdades, e duas variáveis. É útil visualizar graficamente 
a região definida por estas desigualdades. 


“Note que a1x1 + a2x2 +---+anxn < ké equivalente a a1x2 +azx2z+---+anxn+s<ks>O0 


158 CAPÍTULO 4. MATRIZES E TRANSFORMAÇÕES LINEARES 


(iii), xı < 4 
6 
4 
m~ (ii), 3x1 + 10x2 < 40 
(1), 4x1 + 3x2 < 20 
0 4 


Assim, com as restrições e a função objetivo (2.5), temos um problema de programação linear: 


max c'x 
sa: Ax =b, 
x>0 


com 


h )3 20 
a= (515). e= (60) ss 
10 4 10 


A região definida pelas desigualdades é chamada de politopo. 

A solução ótima estará necessariamente num dos vértices do politopo. Como este é um problema pe- 
queno, podemos enumerar as soluções definidas pelos vértices e determinar assim a melhor delas. 

Agora observamos que cada desigualdade da forma 


ax + ax +-+ anXn Sk 


pode ser reescrita como 
a1x1ı + ax +: + aAnXnts = k, 


usando uma variável de folga s > 0. 
O sistema que modelamos, na forma matricial e usando igualdades, é Av = b: 


Xq 
X1 XI S1 S2 S3 
4 3 100 X2 20 
3 10 0 1 0 sı | 57 {40]> 
1 0 0 œ1/{s 4 
S3 


onde sy, s2 € s3 são as folgas das três desigualdades. Indicamos, acima da matriz, as variáveis relacionadas 
a cada coluna. Note que agora procuramos por uma solução em um espaço de dimensão maior (estávamos 
em RŽ, e quando passamos o problema para a forma de igualdade, caímos em R°). 

O espaço-coluna de A é Rº, porque a matriz tem três colunas LI. Podemos formar bases para o espaço- 
coluna de A escolhendo quaisquer 3 colunas LI da matriz. Ao fazê-lo, estaremos escolhendo três das cinco 
variáveis. Dizemos que ao fazer isto estamos construíndo uma solução básica. 
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Definição 4.111. Seja Ax = bo conjunto de restrições de um programa linear com m restrições en 
variáveis. Seja B uma matriz formada por m colunas de A (ou seja, as colunas de B são base para o espaço- 
coluna de A). As soluções de Bx = b são chamadas de soluções básicas para o problema. + 


Por exemplo, considere o problema apresentado anteriormente. Se escolhermos as colunas de x2, s1, 


e s3, teremos 
x Si S3 
3 1 0 X2 20 
10 0 0 sı | = |40]. 


0 
com xı = S2 = 0; X2 = 4; s1 = 8; s3 = 4. 


(iii), xı < 4 
6 
4 
m~ (ii), 3x1 + 10x, < 40 
(i), 4x1 + 3x2 < 20 
(0) 4 


Podemos formar bases diferentes para o espaço coluna de A, e cada base nos dará uma solução dife- 
rente. Além disso, o seguinte Teorema nos garante que estas soluções são pontos extremos do politopo. 


Teorema 4.112. Seja S o conjunto de soluções viáveis para um problema de programação linear. Uma solução x é 
básica se e somente se é ponto extremo de S. 


Como sabemos que só precisamos verificar os pontos extremos, podemos simplesmente verificar as 
soluções básicas. Isto também significa que nos pontos extremos (e portanto na solução ótima) teremos 
somente m variáveis diferentes de zero (incluindo as de folga). 

Experimentamos agora com algumas bases. 

Se usarmos s1, S2 € s3 na base, teremos o ponto extremo na origem, e 


X1 = (0) 
S1 S2 S3 
1 0 0 S1 20 x2 =0 
0 1 0 S2 = 140 |)» S1 = 20 z= 0. 
O 0 17 \s3 4 s2 = 40 
S3 = 4 
com xı = x2 = 0 (ou seja, usamos toda a folga em todas as restrições, e não demos valor positivo a 


nenhuma das variáveis). 
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(ii), xı <4 


(ii), 3x1 + 10x2 < 40 


(), 4x1 + 3x2 < 20 


Se a base for x2, s1, S3, teremos 


X2 S1 S3 
3 1 0\[% 20 x2=4 
[o 0 o) (5) - (8). s1=8 z=40. 
0 01 s3 4 s2=0 
s3=4 
(iii), xı < 4 


m~ (ii), 3x1 + 10x2 < 40 


(i), 4x1 + 3x2 < 20 


Se a base for x1, x2, S3, teremos 


xı = 80/31 = 2.580 


A 3 0 fx 20) x2 = 100/31 = 3.225 
3 10 0 x2 | = |40]; s1=0 z = 1400/31 = 45.161. 


s2=0 
s3 = 44/31 ~ 1.419 
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(iii), xı < 4 
6 
4 
m~~ (ii), 3x1 + 10x2 < 40 
(1), 4x1 + 3x2 < 20 
0 4 


Pode-se fazer o mesmo com todas as outras bases. A que tem maior valor é esta última que calculamos, 
e portanto a solução ótima para o problema é x, = 80/31 e x2 = 100/31. 

Terminamos o exemplo com duas variáveis, e agora olhamos brevemente para o caso em que temos mais 
variáveis e restrições, resumindo o que verificamos antes. Com m restrições e n variáveis, o problema por 
ser descrito como um sistema de inequações lineares, 


dx + ax + ©- + an < bi 
a21% + 2x2 + ec + ankxn < bz 
Amix1 + amzxz + + damn < bm 
Xi > 0. 


Cada inequação pode ser transformada em uma equação através da inclusão de uma variável de folga. 


dx + apx + + an < bi 


T 


Qix + aux + + dinkn + æsi = bi 


&i > 0. 


Suponha que há apenas desigualdades do tipo <. Então adicionam-se m colunas às n já existentes. 


ax + ax + + ankh + mysi = bı 

d21X1 + ax + = + amnkn + Mns: = bz 

AmiX1 + AmX + + mn + Am n+mSm = bm 
Xi, Si 2 0. 


Se o problema só tem igualdades e há mais linhas do que colunas, podemos descartar linhas até obter uma 

matriz quadrada (porque as linhas excedentes são LD, e não modificam a solução do sistema); Um problema 

de otimização linear é descrito portanto por uma matriz com mais colunas do que linhas. Isso significa que 

há colunas LD, e que nem todas as colunas são necessárias para formar uma base para o espaço-coluna. 
Cada base para o espaço coluna corresponde a uma solução básica. 
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Pode-se demonstrar que a solução ótima, se existir, é um ponto extremo, e consequentemente uma 
solução básica, e o que o algoritmo Simplex faz é percorrer cada uma destas soluções básicas até encontrar 
a ótima (o algoritmo Simplex as percorre de maneira inteligente, evitando enumerar todas elas - há (1) 
possíveis bases!). 

Normalmente, programas que realizam otimização linear não armazenam a base inteira. A fatoração 
LU de A é armazenada, e quando uma coluna da inversa é necessária, ela é calculada, como descrito na 


Seção[4.8.1] 


O livro de Matousek [MG07] é u ma introdução à Programação Linear. Abordagens mais aprofundadas 
e detalhadas são encontradas nos livros de Bazaraa, Jarvis, e Sherali [BJS90], de Schrijver [Sch99], de de 
Bertsimas e Tsitsiklis [BT97] e de Luenberger e Ye [LY10]. 


4.8.3 Transformações em imagens [matriz de transformação | 


Rotação por eixo canônico 


Matrizes de rotação ao redor de um dos eixos da base canônica são descritas no Teorema|4.113| cuja de- 
monstração é pedida no Exercício 


Teorema 4.113. Em Rê, seja Rs (x) a matriz de rotação ao redor do eixo s, pelo ângulo «. Para os três eixos da 
base canônica, temos 


1 0 0 cosa O —sena cosa —sena O 
Relo)=[0 cosa —sena |» Ryla) = 01 0)» R-(&) = | sena cosa 0]. 
0 sena cos & sena O cos x 0 01 


Rotação por eixo passando na origem 


Teorema 4.114 (de Euler). Qualquer rotação passando pela origem em tres dimensões pode ser descrita como 
composição de rotações por tres eixos diferentes. 


Se quisermos realizar uma rotação por ângulo O ao redor de um eixo qualquer passando pela origem 
(não necessariamente um dos três da base canônica), podemos usar o seguinte método. 


0. escolha um ponto P, representado pelo vetor (u, v, w)" colinear com o eixo de rotação 
1. aplique rotação por z, deixando o eixo de rotação no plano xz 
2. aplique rotação por y, deixando o eixo de rotação colinear com z 
3. realiza a rotação por 0 ao redor do eixo z 
4. desfaça (2) 
5. desfaça (1) 
Da Geometria Analítica, sabemos que a norma do vetor (u,v, w)! (o comprimento do segmento de reta 


indo da origem até P) é q = Vu? +v? + w2. A figura a seguir mostra o ângulo de rotação (œ) que nos 
interessa para o passo (1), levando o ponto ao plano xz. 
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Verificamos que o comprimento do vetor projetado no plano xy é k = vu? +v2, Da figura também 
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obtemos que 


cos & = u/ yv u2 + v2 
sen & = v/v u2 + v2 


A matriz de rotação do passo (1) pode ser escrita portanto substituindo os valores de cos « e sen «: 


u/vul +v? v/vu?+v2 0 
Ri = | —v/ Vu? +v u/vultv 0 
O) 01 


Olhamos agora a figura com o ponto já no plano xz, representado por p”. O ângulo que nos interessa para 
o passo (2), B, é mostrado na próxima figura. 


X 


Novamente, idntificamos seno e cosseno do ângulo na figura: 


cos B = w/V u2 + v2 + w2 


sen B = Vu? +v2/V u2 +v2 +w? 


A rotação (2) é realizada pela matriz 


w/vVu? +v? +w? O —=vVu? +v?/vVu? +v +w? 
0 1 0 
Vu? +vZ/Vul +v +w? 0 w/Vu? +v? +w? 


A matriz de rotação final é Rj 'R5 'Rz(0)R2R1, que exibimos a seguir. Seja Q = Vu? + vZ + w2. Então 


R2 = 


1 u? +(v2+w?)cos0 uv(l — cos0) —-wgsinO uw(] — cos0) + vq sin 0 
RI RZ'R2(0)R2R1 = — | uv(l— cos 0) + wgsino v2+(u?+w?)cos0 vw(1 —cos0) — uqsin 0 
uw(] — cos0) — vqsinð vw(] — cos 0) + uq sin O w? + (u? +v?) cos O 


Se escolhermos o vetor do eixo de rotação de forma que q = u? + v? + w? = 1, temos 


u? + (v2 +w?)cos0 uv(l—cos0) —-wsinO uw(1 — cos0) + vsinO 
RI'RZ'R2(0)R2R1 = | uv(1 —cos0)+wsin0  v24+(u2+w?)cos0 vw(1-— cos0)— usin® 
uw(1 — cos 0) — vsinO vw(1—cos0)+usin® w? + (u? +v?)cos0 
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Translações 


Para translações em R?, podemos fazer o mesmo que descrevemos na seção usamos uma coordenada 
adicional, que sempre valerá um. Assim, um vetor em R? será representado por 


NC 


f 


A operação que realiza um deslocamento por (u, v, w)" é 
T[(x,y,z)] =(x+Huy+v,z+tw) 
Mas como representamos o vetor com a coordenada adicional, temos 
T[(x,y,z, 1) = (x +u, y +v,z +w, 1) 


A matriz que realiza esta transformação é 


100 u 
010v 
00 Ilw 
0001 


Rotação por eixo arbitrário 


Suponha que tenhamos um eixo qualquer, descrito por dois pontos p, q (ou por um ponto p e um vetor v). 
A operação de rotação ao redor deste eixo pode ser obtida da seguinte maneira: 


1. aplique translação de forma que p fique na origem 
2. aplique rotação pelo eixo transladado, usando o método descrito na seção[4.8.3] 


3. desfaça (1) 


Outras transformações 


As outras transformações lineares escritas na seção[3.4.1|podem ser traduzidas para R? da mesma maneira: 
por exemplo, se partindo de um vetor (x,y,z)", somarmos 2x em y, obteremos (x,y + 2x,z)!, que é o 
cisalhamento realizado pela matriz a seguir. 
t 0 o) 
210 
001 


Outras transformações não lineares, como rotação ao redor de um eixo arbitrário (não passando pela ori- 
gem), podem ser definidas como composição de translação com as transformações lineares que já defini- 
mos. 
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4.84 — Órbitas celestes [ mudança de base ] 


A primeira lei de Kepler para movimento planetário determina que as órbitas de planetas descrevem elip- 
ses, estando o Sol em um dos focos da elipse] 


Suponha que queiramos descrever a órbita de Marte, de maneira simples quando observado a partir 
da Terra. As duas órbitas são elípticas. com o Sol em um dos focos de cada elipse, mas como não estão 
no mesmo plano, uma tentativa de descrevê-las usando o mesmo sistema de coordenadas será bastante 


complicada. 


Ri 


Escolhemos um sistema de coordenadas xyz de forma que a órbita da terra fique completamente con- 
tina no plano xy. 

Seja x” a interseção entre os planos contendo as órbitas de Marte e da Terra. Determinamos outro 
sistema de coordenadas x'y'z” de forma que o plano contendo a órbita de Marte fique contida no plano 
x'y”. 


5As leis de Kepler são um caso especial da solução do problema gravitacional de n corpos onde os corpos são tratados como 
partículas com massa, e há uma única massa suficientemente grande para atrair outras (a do Sol). 
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A inclinação do plano x'y” em relação ao plano xy (o ângulo entre as duas elipses) é dada pelo ângulo 
x, e o ângulo entre xe x' éB. 


Agora, a elipse formada pela órbita de Marte não tem seus eixos alinhados com x’ e y’. Determinamos 
portanto um novo sistema de coordenadas, xy”'z”, onde os eixos da elipse alinham-se com x” ey”. Seja 
y o ângulo entre x’ e x”. 
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n 


Sejam p, p' e p” os vetores dando a posição de Marte nos sistemas de coordenadas xyz, x'y'z' e 


x”y”z". Cada sistema de coordenadas tem uma base formada por três vetores de magnitude um: 


* By: tendo o plano xy alinhado com a elipse descrita pela Terra (sistema xyz); 
* B2: tendo o plano x'y” alinhado com a elipse descrita por Marte (sistema x'y'z'); 


* Bs: tendo o plano xy” alinhado com a elipse descrita por Marte, mas alinhando também os eixos 
da elipse com os vetores da base (xy''z"). 


Para mudar da base B3 para B2 precisamos de uma rotação ao redor de z’ = z”. Seja y o ângulo entre 
o eixo maior da elipse e x”. Então a transformação é 


cosy —seny O 
lidl3=2 = seny cosy O 
0 01 


De By para B2: expressaremos os vetores da base Bj na base B2. Os vetores são 
cos B 


sen p |» 
0 


Observando cuidadosamente a figura das duas bases na página percebemos que os vetores unitários 
x’, y’, z’ são descritos na base xyz como 


cos B rcos(p + 7/2) , pcos(B — 7/2) 
JB, = sen |» ye, = | rsen(B + 7/2) |» Zs, = p sen(B — 7/2) 
0 sen x cos « 


Como os vetores são unitários, temos p = b = sena e q = a = cos «, logo podemos reescrever 


cos B cos «cos( + 7/2) sen acos(fp — 7/2) 
xp, = | sen pB |» yB, = | cos a sen(B + 7/2) |» [zlB, = sen x sen(B — 7/2) 
0 sen « cos « 
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Simplificando através de identidades trigonométricas, chegamos à matriz de mudança de base 


idle, = (x's, Iys, Iz'le, ) 


cosB —cos&senĝß  senasenf 
= | senp cos &cos R — sen «cos ĝB 
0 sen « cos « 


Suponha que conheçamos «, 3, Yy, c, e. Dado o ângulo O descrito por Marte ao redor do Sol, podemos cal- 
cular o raio usando a fórmula que descreve elipses em coordenadas polares, 


ira 1— e? 
w) = c— ~ 
1 +ecos w’ 


onde e é a excentricidade da elipse, e m é o comprimento de seu semieixo maior: 


n2 
e= =z 


A posição em coordenadas polares (r, 0) está relacionada com a posição em coordenadas cartesianas (x”, y”) 
através da identidade 
x” =rcos0 


y” =rsen6 


Assim, o ponto (r, 0) da trajetória, na base Bs, é 


rcos O 
rsenð |: 
0 


Podemos a partir daqui usar o operador de mudança de base [idlg; »p, e seu inverso, [id]lg;—B, para 
efetuar cálculos com estas coordenadas. 

O leitor poderá obter mais informações sobre órbitas no espaço e astrodinâmica nos livros de Roy 
e de Vallado [Val97]. O exemplo dado nesta seção é sugerido por Donald Teets [Tee98]. 


4.8.5 Códigos corretores de erros [ base; espaço-linha; multiplicação à 
direita |] 
Na seção [1.6.4] tratamos brevementet de códigos corretores de erros, e mencionamos que, dado um 
conjunto de mensagens com k bits, um código é um subespaço de Z7. Nesta seção abordamos o processo 
de codificação de mensagens, e o de detecção e correção de erros. 


Quando trabalhamos com códigos corretores de erros, é comum denotar mensagens por vetores-linha, 
e não por colunas. Por exemplo, uma mensagem poderia ser 


m = (1,0,0,1,1). 


Sabemos que uma base para o espaço R”, composto de vetores-coluna, pode ser descrita como uma matriz: 


1 —3 
0o 0 
0o 2 
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é base para um subespaço de R3, porque tem duas colunas LI. 
Da mesma forma, uma base para um espaço vetorial formado por linhas pode ser descrita por uma 
matriz com linhas LI. Seja (R”)* o espaço vetorial formado por todas as linhas com n números reais. 


A matriz 
2 0 0 
0 —1 5 


é base para um subespaço de (IR? )*, com dimensão dois. As linhas neste espaço são combinações lineares 
das linhas da matriz, e portanto são da forma 


a(2,0,0) + b(0,—1,5) = (2a, —b, 5b). 


Como mencionamos no primeiro Capítulo, quando usamos códigos para corrigir erros, precisamos adi- 
cionar informação às mensagens. Assim, uma mensagem com três elementos, por exemplo, seria transfor- 
mada em outra, com cinco: 


codificação 
——+ SS 


(m1, m2, m3) (c1, C2, C3, C4, C5). 


Além disso, usamos somente espaços vetoriais sobre corpos finitos para definir códigos corretores de erros 
(em nossos exemplos, usaremos apenas Z}, portanto toda a aritmética usada será feita módulo dois). Um 
subespaço V de Z}, portanto, determina um código. Uma base para este subespaço é chamada de matriz 


geradora do código. 
Exemplo 4.115. A matriz 
11111071 
G=|1010110 
1001111 


é base de um subespaço de Z7. Este subespaço tem dimensão 3 (porque a matriz tem três linhas LI). G é 
matriz geradora de um código. Podemos listar todas as palavras deste código enumerando todas as linhas 
que podem ser geradas pela matriz: 


0,0,0) -G = (0,0,0,0,0,0,0 
0,0,1) -G = (1,0,0,1, 1,1,1 
0,1,0) - G = (1,0,1,0,1,1,0 
0,1,1): G = (0,0, 1,1,0,0,1 
1,0,0): G = (1,1,1,1,1,0,1 
1,0,1) - G = (0,1,1,0,0,1,0 
1,1,0) - G = (0,1,0,1,0,1,1 
1,1,1)- G = (1,1,0,0,1,0,0 « 


Teorema 4.116. Se G é matriz geradora de um código então existe G’, também geradora do mesmo código, da forma 


(TA) 


Exemplo 4.117. Obteremos uma nova matriz a partir da matriz G, do exemploļ4.115 


DO Dra AO TETE aaa 111101) 
1011 0| == |01 0101 1] =—>lo0o1 01 01 1| = 
01111 0110010 0011001 
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O espaço-linha de G” é igual ao de G, portanto ambas são geradoras do mesmo código. < 


Se G é a matriz geradora de um código, as palavras m são codificadas como “mG”. Assim, as palavras 
do código de canal formam o espaço-linha de G. 


Definição 4.118 (matriz de teste de paridade). Seja G = (T A) a matriz geradora de um código. A matriz 
H=(ATiZ) 

é uma matriz de teste de paridade do código. + 

Exemplo 4.119. Para nosso código, 


E 
FENI 
A= (1 dei ME -aT =at ne 
1001 o 


Note que como em Z2, 160 — 1,porque0O—1=0€1=1,entãoA = —A. 
Assim, 


1 
H=(-ATiZ)= E 
0 

1 
é matriz de teste de paridade para nosso código. < 


Definição 4.120 (síndrome). Se H é matriz de teste de paridade de um código e c uma palavra codificada, 
então Hc! é a síndrome de c. + 


Teorema 4.121. Uma linha c pertence ao código C se sua síndrome é 0. 
A síndrome nos permite, portanto, verificar se uma palavra pertence ao código. 


Exemplo 4.122. A mensaegm c = (0, 0, 1, 1,0,0, 1) pertence ao código, e sua síndrome é 
0 
Hc! = | 0 
0 
0 
A mensagem d = (0, 0,1, 1,0, 0, 0) não pertence ao código, e tem síndrome 


Hd! = 


=.00o0o 
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Teorema 4.123. Se uma palavra codificada c tem no máximo k erros, onde k é o máximo de erros que o código 
suporta, então c tem a mesma síndrome que seu erro. 


Basta, portanto, manter uma tabela de erros e suas síndromes. Quando recebemos uma mensagem com 
erro, verificamos na tabela qual foi o erro introduzido. Podemos portanto simplesmente subtrair o erro da 
mensagem. 


Exemplo 4.124. Nosso código corrige no máximo um erro. Calculamos a síndrome de cada um dos vetores 
de erro a seguir (os vetores são mostrados sem parênteses para simplificar a notação). 


erro síndrome 
0000001 0001 
0000010 0010 
0000100 0100 
0001000 1000 
0010000 1001 
0100000 1011 
1000000 1111 


Agora simulamos o envio de uma mensagem em que um erro é adicionado durante a transmissão. A 
mensagem original é m = (0, 1, 1). Codificada, ela se torna 


c=mG = (0,1,1)G = (0,0,1,1,0,0,1). 


Se durante a transmissão o terceiro bits da mensagem foi trocado, teremos adicionado um vetor de erro 
(0,0,1,0,0,0,0): 


c'=(0,0,1,1,0,0,1) & (0,0,1,0,0,0,0) = (0,0,0,1,0,0,1) C 


O receptor verifica a síndrome da mensagem: 


0 
1111000 |g 1 
H(c)T=|[1000100 11=10 
1100010 0 0 
11100071 0 1 
1 
O erro que tem síndrome igual a (1,0,0,1)! ée = (0,0, 1,0, 0, 0) O receptor calcula portanto c = c' — m, 
obtendo a mensagem codificada original, (0,0,1,1,0,0,1). < 


Exercícios 


Ex. 85 — Sejam A e B tais que AB seja definido. Se A tem uma linha inteira com zeros, o que pode ser 
dito a respeito do produto AB? Qual é o análogo disso para a matriz B? 


Ex. 86 — Mostre que a inversa de uma matriz diagonal, se existir, é também diagonal. 
Ex. 87 — Mostre que se A e B são matrizes diagonais, então AB = BA. 


Ex. 88 — Demonstre a proposição 
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Ex. 89 — Demonstre a proposição 


Ex. 90 — Para cada conjunto de matrizes quadradas abaixo, determine se elas sempre tem inversa, nunca 
tem inversa, ou se podem ou não ter inversa. 


a) Todas as matrizes diagonais. 

b) Todas as matrizes triangulares. 

c) Todas as matrizes obtidas de matrizes diagonais usando apenas permutações de linhas. 

d) Todas as matrizes onde mais da metade dos elementos é composta de zeros. 

e) Todas as matrizes onde mais da metade dos elementos é composta de diferentes números primos. 


f) Todas as matrizes n x n, com n par, onde a diagonal principal e a diagonal secundária não tem ele- 
mentos em comum. 


2 — n +1 elementos são números primos. 


g) Todas as matrizes onde pelo menos n 
h) Todas as matrizes cuja diagonal só contém uns. 

i) Todas as matrizes n x n cujos elementos são os inteiros 1,2,...,n?,em qualquer ordem. 
j) Todas as matrizes contendo uma linha inteira de zeros. 

k) Todas as matrizes contendo uma linha inteira de uns. 

1) Todas as matrizes cuja diagonal é composta de zeros. 


m) Todas as matrizes n x n, com n par, onde a diagonal principal e a diagonal secundária tem somente 
números primos. 


Ex. 91 — Demonstre a proposição 


Ex. 92 — Uma matriz A é quase-diagonal se pode ser particionada em blocos de forma que apenas os blocos 
Aii contém elementos não-nulos. 


Ann 


Mostre que a inversa de uma matriz quase-diagonal é também uma matriz quase-diagonal, particionada 
da mesma forma, onde cada bloco Ai é a inversa do bloco Ai; original. 


(An)! 
A (A22)! 


(Ann)! 


Ex. 93 — Prove o Lemal[4.27] 


Ex. 94 — Prove que o posto de linhas de uma matriz é igual ao posto de colunas, usando a forma escalonada 
reduzida por linhas e colunas. 
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Ex. 95 — Prove que o posto de linhas de uma matriz é igual ao posto de colunas, usando o teorema do 
núcleo e da imagem, e interpretando a matriz como a matriz de coeficientes de um sistema linear. 


Ex. 96 — Para cada matriz, calcule a decomposição LU, se existir, ou a decomposição LUP caso a decompo- 
sição LU não exista. Caso seja necessário determine os valores de x para que a decomposição LU (não LUP) 
exista, 


x 00 x xx 
C=|00x|]5 D=|-2 42 x) 
110 +3 —3 x 


Ex. 97 — Mostre como usar a fatoração LU para clacular A7! B, sem precisar computar A”!. Diga qual 
fatoração LU deve existir para que o método funcione. 


Ex. 98 — Prove o Teoremal[4.100] 
Ex. 99 — Prove que para quaisquer matrizes A e B tais que AB seja definido, 
nul(A) < nul(AB), 


e que 
posto(A) > posto(AB). 


Ex. 100 — Mostre que para todo k, (AjÃ2...Ak)! = Ak tAR, PRA 1 se todas as matrizes A; forem 
n x n e iinvertíveis. 


Ex. 101 — Resolva o sistema de equações usando eliminação de Gauss. 


3x1 — 4x2 + x3=3 


—x1— x2— x3=0 


x1 + 8x2 + 5x3 = —1 


Ex. 102 — Prove que o processo de eliminação de Gauss e o algoritmo de decomposição LU podem ser 
aplicados a matrizes de blocos, e dê um exemplo de cada. 


Ex. 103 — Sejam 


Resolva os sistemas: 
a) Ax = (10,1,-1)T 
b) Ax = (0,2,4)T 
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dAxe(=,=2, 5 
d) Ax = (20,-1,0)" 
e) Ax = (x1,x1,—x1)! 
f) Ax = (x2,x3,—x1)" 
g Ax=T 


Ex. 104 — Ao enunciarmos o Teoremaļ4.95| e ao elaborarmos o Exemplo dissemos que devemos deixar 
a matriz U na forma escalonada por linhas. O que acontece se a deixarmos na forma escalonada reduzida 
por linhas? Porque? 


Ex. 105 — O Teoremaj/4.95|determina condições para a existência de fatoração LU de uma matriz, e o Teo- 
rema/4.98]faz o mesmo para decomposição LUP. Determine as condições para que A tenha decomposições 
UL, PUL e ULP, e mostre como obtê-las. 


Ex. 106 — Mostre que toda matriz pode ser descrita como soma de uma matriz simétrica e uma anti- 
simétrica. 


Ex. 107 — Seja A uma matriz reaf'anti-simétrica de ordem n. Mostre que A = S1S2 — S282, onde S; e 
S> são matrizes simétricas. 


Ex. 108 — Suponha que seja necessário resolver os sistemas Ajx = b, A2x = b,..., Ax = b, onde as 
matrizes A; diferem apenas em uma única linha, Dê um método eficiente para resolver o problema. E se 
as matrizes diferissem em uma única coluna? 


Ex. 109 — Demonstre o teorema|4.92| 


Ex. 110 — Qual é a matriz elementar que inverte a ordem das linhas de uma matriz, de forma que a pri- 
meira linha passe a ser a última, a segunda passe a ser a penúltima, e assim por diante? 


Ex. 111 — No exemplo realizamos diversas operações elementares na matriz dos coeficientes do sis- 
tema. A matriz elementar que representa a primeira delas foi mostrada no final do exemplo. Mostre as 
outras. 


Ex. 112 — Neste Capítulo desenvolvemos um método para fatoração PLU. Prove que toda matriz que tem 
fatoração PLU tem fatoração LUP. Mostre um método para obter tal fatoração, e diga como relacionam-se 
PLU e L'U'P”, quando À = PLU = L'U’ P’. 


Ex. 113 — Mostramos no exemplo que as variáveis aleatórias reais em um espaço amostral formam 
um espaço vetorial. No exemplo mostramos que a esperança é uma transformação linear. Como é 
a matriz da transformação linear que dá a esperança de uma variável aleatória discreta em um espaço 
amostral finito? 


Ex. 114 — A seguir temos bases para R? (o exemplo mostra que uma matriz quadrada não-singular 
pode ser vista como base de R”). 


222 1 2 3 101 4 57 
A=|022), B=|[-3-2 —1], C=|0 1 ol, D=|1 2 0 
0 0 2 2 3 1 011 1 03 


$0u complexa, ou com coeficientes em qualquer corpo infinito. 
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i) Mostre todas as matrizes de mudança de base entre elas. 
ii) Seja v = (1,2,3)" um vetor escrito na base canônica. Mostre v em todas as bases dadas. 
iii) Escreva [(1,—1,0)"]a na base B 


iv) Escreva [(2,1,1)"]c na base D. 
Ex. 115 — Demonstre o Teorema|/4.113 
Ex. 116 — Prove que a rotação em duas dimensões é comutativa, mas que em tres dimensões, não é. 


Ex. 117 — Prove que matrizes de rotação formam um grupo (os elementos do grupo são as reflexões; a 
operação do grupo é composição). Se adicionarmos reflexões, continuamos a ter um grupo? 


Ex. 118 — Mostre a matriz que realiza a mudança de base, em RŽ, da base canônica (e,,e2) para a base 
formada por (f1, f2), tal que: 
D fi = 2,4)"; 


ii) f2 é obtido a partir de fı com uma rotação por 371/4 radianos, 


Ex. 119 — Demonstre a Proposição 


Ex. 120 — A base canônica para Z3 é [001,010,100). Sejam B = (001,011,110e C = (111,110,100) 
duas outras bases para este espaço. 


a) Mostre a matriz de mudança de base de B para C. 
b) Escreva [111]g na base C. 


Ex. 121 — Prove o Teorema|4.109 


Ex. 122 — Sejam 


Resolva os sistemas 
a) Ax (9,1, A)! 
b) Ax = (0,1,0)! 
)Ax=(1+i,—1+1,0)! 


Capítulo 5 


Determinantes 


De toda matriz de números reais pode-se extrair um número real que nos permite determinar diversas 
propriedades da matriz. Este número é chamado de determinante da matriz. Similarmente, toda matriz 
cujas entradas pertencem a um corpo K está relacionada tem um determinante, que é um elemento de K. 
Neste texto, trataremos especialmente do corpo dos reais 


Determinantes estão relacionados a propriedades de sistemas lineares (e de fato, surgiram do estudo 
desses sistemas), mas também estão relacionados a diversos outros conceitos, inclusive o de volume em 
geometria. Neste Capítulo, definiremos uma função que dá o volume de um paralelepípedo em n dimen- 
sões. A partir de três propriedades desta função, mostraremos que ela existe e que é única - e esta será 
exatamente a função determinante de uma matriz que representa o paralelepípedo. 


5.1 Volume orientado 


Definição 5.1 (Paralelepípedo). Seja P = {v!, v2, ..., vK } um conjunto de n vetores linearmente inde- 
pendentes em um espaço de n dimensões. O conjunto de pontos 


av! +av +... + anv“: a € [0,1]} 


é o paralelepípedo gerado pelos vetores. + 


A próxima figura mostra um paralelepípedo gerado por dois vetores em R? e outro, gerado por três 
vetores em R3., 
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u u 


Em R? e R? temos as noções intuitivas de volume e área. Em R, usamos um único vetor, e o volume do 
paralelepípedo é igual à distância da origem até o ponto que o vetor descreve - ou seja, é igual à norma do 
vetor. 

Definimos o volume de um paralelepípedo em um espaço de n dimensões da seguinte forma. 


i) Se um paralelepípedo cabe em n — 1 dimensões, seu volume é zero. Um paralelepípedo cabe em 
n — 1 dimensões quando é descrito por n — 1 vetores, e portanto sua descrição em n dimensões deve 
necessariamente incluir somente n — 1 vetores LI - sua descrição por n vetores é um conjunto LD. 


ii) O volume do hipercubo de lado unitário é um. 


iii) Se multiplicarmos um dos vetores que descreve o paralelepípedo por uma constante, o efeito será 
de “esticá-lo” ou “encolhê-lo”, e o volume será multiplicado pelo mesmo valor. Isso pode ser visu- 
alizado trivialmente no cubo unitário em R3, que é descrito por três vetores e tem volume um: se 
multiplicarmos um dos vetores por k, obteremos um paralelepípedo cuja forma é semelhante à de k 
cubos postos lado a lado. 


u 5 u 


Além de multiplicar um dos vetores por escalar, podemos somar o múltiplo de um dos vetores a 
outro, sem que o volume seja modificado. Na figura a seguir, somamos —1/2u ao vetor v, gerando 
um paralelepípedo diferente. 
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Ao sobrepormos as duas imagens, vemos que o paralelepípedo modificado tem o mesmo volume do 
primeiro (a área sombreada da esquerda só está em um deles; a da direita só está no outro - e as duas 
tem o mesmo volume). 


v—u/2 


Uma consequência imediata disto é que dois paralelepípedos P1 = (v1, V2, ...,w) e P2 = (v1, V2,..., u) 
que diferem somente em um vetor estão relacionados da seguinte maneira: o volume de P3 = 
(v1, V2, . . ., W + u) é a soma dos volumes de P4 e P2, como ilustra a seguinte sequencia de figuras. 


Começamos com o paralelepípedo P(u, v), e desenhamos em seguida o paralelepípedo P(u, w). 


Agora desenhamos o paralelepípedo P(u, v + w). Em seguida, fazemos a reflexão do paralelepípedo 
P(u, w) emu, resultando em P (u, w’) somente para facilitar a visualização. 


V+HW 
V+W 
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Agora, sabemos que as tres retas indicadas na figura da esquerda, a seguir, são paralelas a u. Somamos 
múltiplos de u aos paralelepípedos, deslocando-os por estas retas, até que fiquem alinhados como 
na figura da direita (mostramos anteriormente que podemos fazer isto sem mudar o volume dos 
paralelepípedos). 


Agora fica claro que 


vol [P(u,v +w)| = vol [P(u,v)| + vol [P(u,w)] 


Assim, se fixarmos n — 1 vetores e descrevermos o volume como função de um deles, 
V(w) = vol(vi,V2,...,5W,...,Vn), 


o volume deve ser linear em cada uma das colunas que descrevem o paralelepípedo. Ou seja, para 
quaisquer vetores u, w e qualquer escalar k, 
V(kw) = kV(w) 
V(w+ u) = V(w) + V(u). 


Isso significa que o volume é uma função multilinear de seus argumentos (que são vetores coluna). 


O item (i) significa que se o conjunto tiver n vetores LD o volume é zero. O item (ii) determina que o 
volume do paralelepípedo definido pelos vetores e1, ez,..., en é um. 

Se quisermos representar paralelepípedos como matrizes, podemos simplesmente alocar cada coluna 
(ou cada linha) da matriz para um dos vetores. Assim, o paralelepípedo descrito pelos vetores (1,0,0)", 
(0,2,0)! e (0,1,5)! pode ser representado pela matriz 


100 
021 
005 


Como já observamos, para os paralelepípedos com volume diferente de zero, as colunas da matriz serão 
sempre linearmente independentes (de outra forma o sólido caberia em n — 1 dimensões). 


5.1.1 Orientação 


Quando o volume de um paralelepípedo é diferente de zero, a função determinante nos dará não apenas o 
volume, mas também sua orientação. 
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Um paralelepípedo em R” só tem volume se é descrito por n vetores L.I., porque se os n vetores fo- 
rem L.D. haverá pelo menos dois deles representando o mesmo hiperplano, e o paralelepípedo então teria 
volume zero - e portanto um paralelepípedo tem volume não-nulo se e somente se é uma base para R”. 

Por exemplo, em R? um par de vetores só tem volume se os vetores não são colineares (ou seja, se 
são L.1.). Em R? o mesmo vale: três vetores só descrevem um paralelepípedo com volume se forem todos 
LI. quando tomados dois a dois. Ao tratarmos desses objetos geométricos, nos referiremos então a “bases 
ordenadas”, já que cada paralelepípedo equivale a uma base. 

Damos aqui definições informais de orientação de bases em R? e R3. 

Denotamos a orientação de uma base B por O(B), ou O(b1,b2,...). 

EmR!, cada vetor (x) pode ser representado geometricamente na reta real como um segmento de reta 
com uma de suas extremidades no zero. Este segmento tem cumprimento x, e diremos que a orientação de 
dois vetores é a mesma (ou que suas orientações são concordantes se a magnitude de ambos tem o mesmo si- 
nal (são ambos positivos ou ambos negativos). Desta forma dividimos os vetores em dois conjuntos: aqueles 
à esquerda do zero e aqueles à direita do zero. 

Neste texto, decidimos arbitrariamente que a orientação dos vetores à direita do zero é +1, e que a 
orientação dos vetores à esquerda do zero é —1. 


Exemplo 5.2. Os vetores mostrados nas duas figuras são (—2) e (2.5); o primeiro tem orientação negativa, 
e o segundo tem orientação positiva. 


=2 0 0 23 


E as eo — 
| | 
T T 


< 


Informalmente, dizemos que duas bases ordenadas de R? tem a mesma orientação se os vetores de 
ambas são listados no mesmo sentido - horário ou anti-horário, e negativa caso contrário. 

Novamente decidimos, arbitrariamente, que uma base com vetores listados no sentido anti-horário tem 
orientação positiva, e uma base com vetores listados no sentido horário tem orientação negativa. 

Podemos definir orientação em Rê da seguinte maneira: sejam (v1, v2, V3 ) e (w1, w2, W3) bases de R3. 
Estas bases podem ser representadas no espaço por três vetores cada uma. 

Podemos imaginar movimentos rígidos entre estes vetores (isto é, movimentos que não mudam as dis- 
tancias e ângulos entre eles). Através de movimentos rígidos, posicionamos as duas bases de forma a ali- 
nhar v3 e w com o terceiro vetor da base canônica, ez. Obtemos assim duas novas bases, (vi, v5, v4) e 
(Wi, W5, W$). As bases originais de R? tem a mesma orientação se e somente se ao percorrermos pontos 
em v/,V5,V3, “giramos no mesmo sentidd'} que se percorrermos três pontos em wj, w}, w4. Esta noção 


` 


é equivalente à “regra da mão direita”. 


5.2 Determinantes 


A função determinante será positiva se a orientação do paralelepípedo for a mesma da base canônica, e 
negativo se a orientação for oposta. Para obter apenas o valor do volume, basta desconsiderar o sinal. 
Queremos então uma função que nos dê o volume destes sólidos. Esta função terá como argumento uma 
sequência de vetores coluna - ou equivalentemente, uma matriz quadrada. A função determinante deve 
obedecer as propriedades que definimos anteriormente para volume com sinal. Uma função que obedeça 


lEsta não é uma definição formal! 
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aquelas propriedades é chamada de função determinante; a definição dada a seguir traduz as propriedades 
para a representação por matrizes. 


Definição 5.3 (Função determinante). Uma funçãd] det: Mnxn — R é uma função determinante se e 
somente se tem as seguintes propriedades. 


i) det(A) = O se A tem colunas LD. 
ii) det(T) = +1. 
iii) det(A) é forma multilinear das colunas de A. 


O item (iii) significa que uma função determinante é uma transformação linear quando fixamos todas as 
colunas e variamos apenas uma delas: para todo escalar À, todo vetor coluna v, e toda coluna c;, 


det(c1,...,Ac;,...,Cn) = Adet(c1,...,Cj,...,Cn) 
det(ci,...,c; +v,...,Cn) = det(cy,...,c;,...;cn) + det(cr,...,V,...,Cn). + 
Note que a definição acima pode ser facilmente generalizada para corpos em geral, e não apenas R. 


Exemplo 5.4. Definimos uma função D : M2x2 — R, tal que 


TOR 


Mostramos agora que esta função satisfaz as propriedades que propusemos, e portanto ela é uma função 
determinante. 


i) Seas colunas de A são LD, D(A) deve ser zero: 


D(a ka) = kab — kab = 0. 
b kb 


D(! 0)=1=9=1. 
01 


iii) Se fixarmos uma coluna, o determinante é linear na outra. Verificamos a multiplicação por escalar: 


ii) O determinante de Z é 1: 


D( +) = had — Abc = A(ad — be) = AD (s p) 
c Ad cd 


Verificamos a soma: 


a bR — — 
D(s e) a(d+5)-e(b+8) 


= (ad — bc) + (aô — Bc) 


Ri ad 


2É também comum denotar o determinante de uma matriz A por |A|. Evitamos esta notação porque já usamos | - | para módulo. 
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Ilustramos o uso desta função a seguir. 


121- — a RR pa 
D(! 2) (165 (3)2)=5-6=—1. < 


Verificaremos agora que qualquer função com estas propriedades será necessariamente alternante (o 
valor da função mudará de sinal se trocarmos dois de seus argumentos de posição). Isso significa que o 
determinante de uma matriz A dará a orientação da base composta por suas coluna{] 


Teorema 5.5. Uma função determinante é alternante - ou seja, quando dois de seus argumentos (que são colunas 
de uma matriz) tem suas posições trocadas, o valor da função é multiplicado por —1. 


Demonstração. Seja uma matriz quadrada com colunas a; e aj, tal com determinante x. Suponha que quando 
trocamos as duas colunas de lugar, o determinante passa a ser um outro valor y: 


det(. .. Mp jp e) =X 
det(. 1 Ba +» A) =Y. (a; — aj) 
Agora, se somarmos cada uma dessas duas colunas à outra, temos uma nova matriz, e seu determinante 


será 
det(..., ay aj... ,aj Ha N=0, 


porque as colunas são LD (há duas colunas iguais). 
Mas como o determinante é multilinear, 


det(...,apt-a;a;+as...) 
=det(...,ai, ai Pa...) 
+det(...,aj, a +aj,...) 
= | det(... ava...) (5) 
+ det(...,ai, aj.. | (abrindo o primeiro a; + aj) 
Ef dett.. aa...) (x) 
+ det(...,aj,ai,.. ] (abrindo o segundo a; + aj) 
= dell... ai, ajy.. -) (porque os casos (x) com colunas iguais são zero) 
+det(...,aj, ai.) 
=X+UY, 


ecomox+y =, 
Xx=-U. E 


Exemplo 5.6. Verificamos agora o efeito de uma mudança de linhas em uma matriz de ordem 2. Seja 


o) selo) 


3A relação entre orientação e a troca da ordem dos vetores da base está detalhada no Eita T no Apêndice[y] página 
A demosntração do teorema é pedida no exercício e uma idéia superficial de como poderia ser a demonstração se encontra no 
Apêndice[€] 
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Então 


det A = —1 — 6 = -7 
det B = 6+ 1 =7. 


< 
A seguir listamos o efeito de operações elementares sobre o determinante de matrizes. 
Teorema 5.7. Seja A uma matriz quadrada. Então 
i) det(Ei jA) = — det A, se i Æ j (se trocarmos duas linhas de uma matriz, o determinante é multiplicado por 


—1); 


ii) det(EeriA) = c det A (se multiplicarmos uma linha de A por c o determinante também é multiplicado por 


c); 
iii) det(E;,c1;Ã) = det A (adicionar múltiplo de uma linha a outra não modifica o determinante). 
Do Teoremal5.7/obtemos o Lema a seguir, cuja demonstração é pedida no exercício 


Lema 5.8. Seja E uma matriz elementar e A uma matriz quadrada, ambas de mesma ordem. Então det(EA) = 


det(E) det(A). 


Com estes fatos já é possível obter o determinante de matrizes, se soubermos como escrevê-las como 
produto de matrizes elementares. 


Exemplo 5.9. Sabemos que o determinante da matriz identidade é um. Consequentemente, 


det Ei, = —1 
det Eeli = € 
det Ei+clj =1 


Consequentemente, podemos deduzir que se 


A = E1 2E2111 E14+5127 


09003) 


então 


det A = det(E1,2E>211E14512)7) 
= det E1 2 det (E211E145127) 
= (—1) det E21 ı det (E1+5127) 
= (—1)(2) det E1+512 det(Z) 
= (—1)(2)(1)(1) = —2. «4 
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Outras propriedades de uma função determinante são discutidas a seguir. 
Teorema 5.10. Sejam A e B matrizes quadradas de mesma ordem. Então det(AB) = det(A) det(B). 


Demonstração. Se A é singular, det(A) = det(AB) = 0, porque AB também não é singular. 
Se À não é singular, então é produto de matrizes elementares: 


A = E1 E2... Ex. 
Então, 
det(AB) = det(Ej E»... EB) 
= det(E+) det(E>) - - - det(Ex.) det(B) (pelo Lemaf5.8) 
= det(A) det(B), 
completando a demonstração. E 
Exemplo 5.11. Sejam 
Ra? YB B=(2NZ 
war] D2)’ 
e consequentemente 
Po ( 7 12 
-7 06)" 
e 
det AB = (ab) (ab)22 — (ab)ı2(ab)21 
= (7)(6) — (10)(=7) 
= 112 
Temos 
det A = (a) (a)22 — (a)ı2(a)21 
= (2)(—1)= (3)(4) 
= —14 
det B = (b)11 (b)22 — (b)12(b)21 
= (—1)(2) — (2)(3) =—8 
Claramente, det A det B = det(AB), ou seja, (—14)(—8) = 112. < 


(o) exercício[133]pede a demonstração do Teorema a seguir. 
Teorema 5.12. Sejam A uma matriz quadrada de ordem n e c um escalar. 
i) det(A) = det(A!). 
ii) det(cA) = c” det(A). 


iii) det(A) = 0 se A tem uma linha ou coluna com zeros. 
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iv) det(A) = 0 se e somente se A é singular. 


v) det(AT!) = Ialay Se A tem inversa. 


Do item (iv) do Teorema obtemos também o seguinte corolário. 
Corolário 5.13. Um sistema de equações lineares Ax = b é determinado se e somente se det A Æ 0. 
Lema 5.14. O determinante de uma matriz diagonal é o produtório dos elementos em sua diagonal. 


Demonstração. Seja A uma matriz diagonal. Como o determinante é multilinear, 


e por indução nas colunas, det(A) = aj1022... ann det(T). E 


O seguinte Lema garante que existe determinante para matrizes triangulares. 
Lema 5.15. O determinante de uma matriz triangular é o produto dos elementos de sua diagonal. 


Demonstração. Seja A triangular superior. Aplicando eliminação de Gauss obtemos uma matriz diagonal. 
Se não houve troca de linhas durante o processo de eliminação, temos det(A) = Į J; ai. 

Se houve troca de linhas, o resultado será uma matriz com alguma linha inteira igual a zero, e portanto 
det(A) = 0. 

O mesmo se aplica a matrizes triangulares inferiores, porque det(A) = det(A! ). E 


Observe que este Lema também nos dá uma forma de calcular o determinante de qualquer matriz qua- 
drada: se pudermos pô-la na forma triangular sem troca de linhas, somente usando operações elementares 
do tipo Ei, «1, seu determinante será o produto da diagonal. Quando houver troca de linhas, podemos lem- 
brar a quantidade de trocas, e quando esta for ímpar, multiplicamos o produto da diagonal por —1. 


O Exercício[128]pede a demonstração do Teorema 
Teorema 5.16. Matrizes similares tem o mesmo determinante e o mesmo traço. 
O Lemaj5.17)será usado quando descrevermos métodos para calcular determinantes. 


Lema 5.17. Se uma coluna i de uma matriz é combinação linear das outras (ou seja, as colunas são LD), então o 
determinante da matriz não muda se substituirmos a coluna i por zeros. 


Demonstração. Se uma coluna i de A é combinação linear das outras, então uma linha i de AT é combinação 
linear das outras. Mas isto é o mesmo que dizer que a linha i pode ser obtida a partir da linha zero, somando 
múltiplos das outras linhas. Somar múltiplos de linhas a outras é uma operação elementar que não muda o 
determinante, portanto a matriz teria o mesmo determinante se a linha i de A! fosse zero. Como det A = 
det AT, terminamos a demonstração. E 
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5.3 Existência e unicidade do determinante 


Até agora temos falado de “funções determinante” (aquelas que satisfazem a definição [5.3); até mesmo 
definimos “uma” função determinante para matrizes de ordem dois. No entanto, não mostramos que existe 
uma função determinante para matrizes quadradas de qualquer ordem. E não provamos também que não 
há funções diferentes que satisfazem a definição. 

Começamos pela existência. Para provar a existência do determinante para toda matriz, simplesmente 
mostramos um método para calcular determinantes de matrizes qualquer ordem. 


Teorema 5.18. Toda matriz quadrada tem um determinante (ou “há uma função determinante definida para todas 
as matrizes quadradas”). 


Demonstração. Segue diretamente do Teorema e do Lema como podemos decompor qualquer 
matriz A em 


A =PLU, 
temos 
det P = +1 (matriz do tipo Ei;) 
detL = 1 (triangular, tem uns na diagonal) 
detU = HI Uii. (triangular) 


Assim, como os tres determinantes são definidos, então para qualquer matriz A = PLU, 
det A = det P det U. E 


Nossa demonstração de existência não garante unicidade, porque a decomposição LU não é única. As- 
sim, provaremos em seguida a unicidade do determinante. A técnica usual para mostrar que algo (uma 
função, ou qualquer outro objeto matemático) é único consiste em presumir que haja dois objetos satisfa- 
zendo a definição, e depois provar que ambos tem que necessariamente ser iguais. 


Teorema 5.19. O determinante de qualquer matriz é único. 


Demonstração. Sejam det!) e det!?! duas funções determinante para matrizes de ordem n. Seja também 


6 = det! — det” a diferença entre elas. 
Sabemos que para qualquer matriz quadrada A vale uma das duas afirmações: 


i) Se A não é singular (ou seja, tem inversa), existe uma sequência de matrizes elementares que trans- 
formam A na identidade: 
E1 E2. . EKA = J. 


Como cada E; tem inversas, podemos isolar a matriz A, 
N-I iel 
A= Ez... EE). 


ii) A é singular (não tem inversa). Neste caso, podemos levá-la à forma triangular, e a matriz resultante 
terá uma linha inteira com zeros. Assim, existe uma sequência de matrizes elementares que somam 
múltiplos de linhas a outras, ou seja, que não mudam o determinante, e que transformam A numa 
matriz 

X = E1 Ezer EkA 
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contendo uma linha inteira de zeros (ou seja, ao tentarmos resolver o sistema linear percebemos que 
a matriz é singular). Podemos também escrever 


A ER ES A 
Tratamos o caso (i). Observamos que 
(A) = det! (A) — det! (A) 
= det (Ep! .. ESET!) — det?’ (Epi ESET). 


(1) 
= det! (EÇ!)...det(E5 "det! (E7!) — det?) (ER)... det (ES det!) (ET!) 
(porque det AB = det A det B) 


Mas como, de acordo com o Teorema 5.7] as duas funções determinante devem dar o mesmo valor para 
cada matriz elementar, 


S(A) = det! (EÑ!) ... det! (ES! det) (ET!) — det) (ER)... det? (Es! )det (ET) 
=0. 


Assim, no caso (i) temos (A) = 0. 
Agora abordamos o caso (ii). Se X tem uma linha com zeros, 


5(X)=0-0=0, 
e como 
5(A) = det (A) — det?! (A) 
= det (EÑ! ... E7 EȚ'X)— det” (EÑ! ... EZ EȚ!'X) 


k 
= det (EÑ! ... E7 Er! det! (X) — det? (E7! ... E3 Eq! det) (X) 
(porque det AB = det A det B) 


= det (E! ... ESET! )(0) — det? (Ez! ... E7 EȚ!')(0) 
=0-0=0, 


no caso (ii) também temos 5(A) = 0. 
Assim, ô(A) = O para toda matriz À, e portanto det!) = det!” E 


5.4 Calculando determinantes 
Nesta seção tratamos de como calcular determinantes. Embora nossa atenção fique voltada especialmente 


ao corpo dos reais, é importante observar que no cálculo de determinantes, as operações usadas devem ser 
aquelas definidas para o corpo ao qual as entradas da matriz pertencem, como mostra o exemplo 


a 


Exemplo 5.20. Seja 
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uma matriz com entradas em Z2. Seu determinante é 


det A = q11022 — 012021 
= (MD e (0)(1) 
=190 
=1. 
O determinante de A também poderia ter sido obtido a partir dos elementos da diagonal, porque A é 


triangular: 
det A = a110a22 = (1)(1) = 1. < 


5.41 Determinantes de ordem 3: regra de Sarrus 


Para ordem 3, a regra de Sarrus diz que 


abc 
det (à e ) = qei + bgf + dhc — ceg — bdi — fha. 
g hi 
Pode-se verificar que esta fórmula também mantém as propriedades de função determinante. 
Há uma ilustração muito usada como auxílio para que se possa recordar deste regra: copiamos as duas 


primeiras colunas da matriz, pondo-as no lado direito. Em seguida, traçamos a diagonal principal e duas 
outrs paralelas, com linha contínua; a diagonal secundária e duas outras paralelas, com linhas tracejadas. 


a11 a12 a13 a11 a12 


=. > T 
- 
, P # 


A figura nos diz que devemos somar os produtórios das diagonais marcadas com (+), e subtrair do resultado 
os produtórios das diagonais marcadas com (—). 


13 —3 
A=ļ|2 1) 2 
5 0 4 


A regra de Sarrus nos diz que o determinante é dado por 


Exemplo 5.21. Seja 


1.03, 3 
aW e 
z-i 2 


2 =l 
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E portanto temos 
detA = +(1)(—1)(4)  +(3)(2)(5) +(—3)(2)(0) 


5.4.2 Escalonamento e decomposição LU 


Se uma matriz quadrada A tem ordem n > 3, podemos escaloná-la e calcular o produtório da diagonal, que 
será igual ao determinante. Se houver troca de linhas em quantidade ímpar, multiplicamos o determinante 
por —1. 

Há algoritmos muito eficientes para obter a decomposição PLU de uma matriz, portanto também po- 
demos tomar sua fatoração PLU e calcular det P det L det U, ou simplesmente det P det U, porque o deter- 
minante de L sempre será um. 


Exemplo 5.22. A seguir mostramos uma matriz e sua decomposição LU. 


1 2 0 4 1 o 0AA 20 4 
A=| 3 0—2 oļ_— 1 0 0] |0 —6 —2 -12 
—1 -1 TW —1 —1/6 APITO 0 2⁄3 -2 
0 0 3 0 0 0 9/2 1 0o 0 0 9 
O determinante de A é (—6)(2/3)(9) = —36. < 


Este é o método mais usado na prática para obtenção de determinante. Podemos resumi-lo da seguinte 
forma: se a decomposição PLU de A é A = PLU, então 


det A = [51)* [us 


onde k é a quantidade de operações de troca de linhas usada ao fatorar A em PLU. 
Não mostraremos que este método de fato resulta em uma função determinante porque já o fizemos 
quando mostramos que o produtório da diagonal de matrizes triangulares é o determinante da matriz. 


5.4.3 Expansão de Laplace 


Apesar do uso de escalonamento ou decomposição PLU ser mais eficiente para calcular determinantes, há 
um outros método, bastante conhecido, que pode ser útil em algumas situações, e que é importante no 
desenvolvimento teórico de outros fatos. 


Definição 5.23 (Menores e cofatores). Seja A uma matriz quadrada. Denotamos por [A];; a matriz de 
ordem n — 1 obtida de A removendo sua i-ésima linha e j-ésima coluna. 

O menor complementar de A relativo ao elemento a;; é det[Al;;. 

O cofator de um elemento ai; de A é (—1)' det[A];;. Denotamos cof (A, i,j). + 


2 -5 1 
A=| 0 37 
E 46 


Exemplo 5.24. Considere a matriz 
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O menor complementar do elemento a23 é 


det[A]23 E 5)-2.4 (-5)(-1) =8-5=3. 


Já o cofator é (—1)2*3 det[A]23 = —3. a 


O Teorema de Laplace explicita um método para obtenção do determinante de uma matriz quadrada 
de qualquer ordem. 


Teorema 5.25. Seja A uma matriz quadrada. Então, para qualquer linha i de A, 


det(A) = 3 ai(— 1)" det([Al;). 
j 


A demonstração a seguir foi redigida em grau de abstração e concisão um pouco acima do usado no 
resto do texto, e deve ser considerada opcional. 


Demonstração. Como o determinante é único, basta mostrar que a função definida pela expansão de Laplace 
tem as propriedades que definem a função determinante. 

(i) det(Z) = 1. Segue por indução. A base é det(1) = 1. A hipótese é que det(Zķ—1) = 1. Para o passo, 
tomamos Tx, Basta dividir a matriz em blocos: 


O determinante, de acordo com a expansão de Laplace é 1 multiplicado por det(Tx 1), que é 1. 

(ii) Colunas LD implicam em determinante zero. Mostramos simplesmente que se há uma coluna zero, o 
determinante é zero (o Lema[5.17]nos diz que isso implica que o determinante deve ser zero também quando 
há colunas LD). 

Se há uma coluna zero na matriz, haverá em todos os menores, e portanto todos os cofatores serão zero. 

(iii) Determinante é multilinear. Para mostrar a multilinearidade, escolhemos uma linha i e mostramos 
(a) o efeito da multiplicação da linha i por um escalar k; e (b) se duas matrizes A e B são iguais, diferindo 
apenas pela i-ésima linha, o determinante de A + B é o determinante da matriz que difere delas por ter a 
soma das duas linhas diferentes na posição i. 

(a) Multiplicação de coluna i por escalar k: mostraremos que cada termo da soma na expansão de Laplace 
é multiplicado por k: 


det(A) = (kay (D+ det([A];) =k} ay(—1)" det([A];) 
j j 


O j-ésimo termo é multiplicado por k porque seu coeficiente na expansão de Laplace é kaij. 
(b) Se A e B são iguais, diferindo apenas pela linha i, ou seja, 
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então temos 


det(C) = > (aj +bi;)(— 1)" det([A];;) 
j 


=|} _(ay)(~1)Ħ det([A]y)| + |) (by)(- 1) det([A];;) 


j j 


= det A + det B. E 
Exemplo 5.26. Seja 
1 & I2 
A= 03 4 1 
35 0 0 
AL273 1 


Evidentemente escolhemos a linha com dois zeros, para facilitar o cálculo. 


det A = 3(—1)°+! det[A]31 + 5(—1)3+2 det[A]32 + 0(—1)?*? det[A]33 + 0(—1)2*+4 det[A]34 
=3(—1)2*! det[A]31 + 5(—1)2+2 det[A]32 


2 —1 2 1-1 2 
=3(—-1)24 det É 4 ) EE 56) 2 det O 4 |) 
1 pa 


=3.1+(-5)(-6) = 33. < 


5.4.4 Fórmula de Leibniz 


Embora tenhamos descrito métodos para calcular o determinante de matrizes de ordem n, nenhum deles 
era uma fórmula (uma forma fechada). Há uma fórmula que descreve o determinante, chamada de fórmula 
de Leibniz. 


Definição 5.27 (permutação). Uma permutação é uma função que recebe uma tupla de n elementos e de- 
volve outra tupla, com os mesmos elementos, reordenando-os. 
Denotamos por Sn o conjunto de todas as permutações de n elementos. + 


Exemplo 5.28. Seja o a permutação que recebe quatro elementos, e devolve o primeiro na terceira po- 
sição, o segundo na primeira posição, o terceiro na segunda posição e o quarto em sua posição original. 


Denotamos esta permutação por 
1234 
2314 


Assim, c(a, b,c, d) = (b, c, a, d). < 


Na fórmula de Leibniz usaremos permutações dos índices das colunas da matriz. Quando denotarmos 
Qi o O significado é “o elemento da matriz, na linha i e a coluna dada pela permutação o no i-ésimo 
argumento (ou seja, o(i)). Por exemplo, usando a permutação 


a) 
213 


teríamos a1,s, iguala a12; a2,o, igual a a2,1; € az,o, iguala a3 3. 
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Definição 5.29 (paridade de permutação). A paridade de uma permutação o é denotada por sgn(o), e é +1 
se o número de inversões que aquela permutação induz é par, e —1 se o número de inversões é ímpar. 4 


Exemplo 5.30. Sejam 01, 02 € 03 permutações: 


m=(123) m=(1 234) m=(1234) 
213 3412 4123 


A permutação o1 tem uma única inversão, 2 & 1 portanto sgn(01) = —1. 
A permutação 072 tem quatro inversões, 3 6 1,3 & 2,4 © 1,46 2, portanto sgn(01) = +1. 
A permutação 04 tem três inversões, 4 > 1,4 62,46 3 portanto sgn(01) = —1. < 


Teorema 5.31. O determinante de qualquer matriz quadrada A é dado por 


det(A =) sgn(o o) | [aio 
i=1 


cESn 


O determinante de A é uma soma com n! termos (um para cada o em Sn). Cada termo é da forma 


(EDaga-...ao. 


Os índices indicados por [O nesta última fórmula são os índices 1, 2, . . . , n, permutados de alguma forma, e 
o sinal +1 é +1 se o número de inversões desta permutação é par, e —1 caso contrário. 


Demonstração. Mostramos que a função expressa pela fórmula de Leibniz tem as propriedades de função 
determinante. 

(i) det(Z) = 1. Pode-se verificar claramente que todos os termos do somatório na fórmula de Leibniz 
serão zero, exceto 11 022 ... Ann, que resultará em 1. 

(ii) Colunas LD implicam em determinante zero. Usamos o Lema[5.17]e mostramos que se há uma coluna 
zero, o determinante é zero. Se uma coluna i é composta de zeros, teremos aij = O para todo j. Mas cada 
termo da soma na fórmula de Leibniz inclui ain, e portanto todos os termos serão zero. 

(iii) Determinante é multilinear. Mostraremos (a) que a multiplicação de uma linha por escalar resulta na 
multiplicação do determinante pelo mesmo escalar; e (b) que se A e B diferem somente na linha i, então 
a soma dos determinantes de A e B é o determinante da matriz que só difere de A e B por ter a soma da 
i-ésima linha (de A e de B). 

(a) Multiplicar uma coluna por k gi multiplicar todos os aig por k. Como na fórmula de Leibniz 
cada termo terá exatamente um aip: 


sgn(o1)agı +: Kapı +: apn + sgn(o2)ag +- kapı -++ agon + 


fatoramos e obtemos k multiplicado pelo valor anterior de determinante: 


k(sgn(oi)a 1: dm: agn +sgn(o2)an, cam aon +4 +) 


(b) se A e B são iguais, exceto pela linha i, ou seja, 
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então 


n 
det(C Epa sgn( o) ] [co 
j=1 


OESn 


Mas como em cada permutação haverá um elemento da linha i (ou seja, a linha contendo « + ß), 


det(C) = ba sgn(o (Too) Gio; Hbi, o) 


oESn ji 
= J sglo)( [cin ) le) + Z seto (TI cio) Ore.) 
0ESn Pad 0ESn jZi 
n 
= E seno] [664 Z sento] [tio 
cESn cESn j=1 
Sud E 


Exemplo 5.32. Seja 
Q11 Q12 13 
A= | a2 az» az 
a31 Q32 Q33 


As permutações de (1, 2, 3) e suas paridades são 


1,2,3), +1 
AN3 1), +1 
3,1,2), +1 
EAR 
2,1,3), —1 
3,2,1), —1 


Então 


det(A) = E sgn(o) | [ aio 
i=1 


c€Sn 
= +11 022033 


T 012023031 


+ 0130271 032 
— 0711023032 
— 012021033 
— 0130220371, 


exatamente como descrevemos anteriormente pela regra de Sarrus. < 
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5.4.5 Por blocos 


Pode ser útil em diversas situações calcular o determinante de matrizes particionadas em blocos. Nesta 
Seção apresentamos alguns Teoremas a respeito destes determinantes. 


Teorema 5.33. 


det (a B) = det A det D. 
0 D 


Exemplo 5.34. 


12:37 20 
da [A io] cam (Jaa (g 4) -én 
00:2 9 3 8 21 
00:17 4 
«4 
Teorema 5.35. Seb é coluna, c7 é linha, e d é um único elemento, 
des (A b) = (d + 1) det A — det(A + bc! ). 
c 
Exemplo 5.36. 
1 2 37,20 
i 1 2 37 20 
det |3 8 11 0| =(44+1)detl3 8 71]-det|lA+[0](0 01) 
00 42.1) 0 0 2 9 
00 1:4 
1 2 57 
=(5)(4)-det|3 8 1 
0 0 11 
= 20 — 22 = —2. < 


5.5 Matrizes complexas 


O determinante de uma matriz complexa é definido e calculado da mesma forma que o de matrizes reais. 
Teorema 5.37. Seja A uma matriz quadrada complexa. Então 

i) det(A") = det A, 

ii) Tr(AH) = TrA. 


Exemplo 5.38. Se 


temos 


AH={_ 1 3 o). 
1+i 2+i 


196 
Agora, 
det A = det (1 o i) — (3 — 3i) = 
3 2—i 
e 


det A™ = det ( l 3 )=0+9-6+3)= 


1+i 2+i 
Exemplo 5.39. Se 


A(2Z 1-1), AH = À 3 4, 
3 2-1 I+i 2+i 
temos 
Tr(A)=4-—i 
Tr(AH) = 441. 


5.6 Aplicações 


5.6.1 Regra de Cramer 
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1+2i 


—1 — 2 < 


A “regra de Cramer” é um teorema que dá um método simples para resolver sistemas de equações lineares 
usando determinantes. É possivelmente a aplicação mais conhecida de determinantes. 


Teorema 5.40 (Regra de Cramer). Em um sistma linear representado por Ax = b, onde o vetor x é a incógnita, 


tem-se que 
= det(Ai) 


aii 
"o det(A)’ 
onde A; é a matriz obtida trocando a i-ésima coluna de A por b. 


Demonstração. Seja s a solução para As = b- ou seja, 


01181 + A1282 +... + QynSn = by 


d21S1 + 2282 +... + a2nSn = b2 


an1S1 + An282 +... + AnnSn = bh 


Agora, multiplicamos cada i-ésima equação pelo cofator Ai1. 


A111181 + Asiqi282 +... + Agi dinSn) = A11b1 
Az102181 + Azyd2282 +... + AziaznsSn = A21b2 


An10n1s1 + Ani dn282 +... + An1dnnSn = An1bn 


Somando as equações, obtemos 


si(Ar am + Å21021 +... + An1anı) 
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+s2(A11012 + A214022 +... + An1an2) 


+sn(Aiidin + A21027 +... + Anann) 
=b1 A11 + b2ÅA21 +... + bnAnı. 


O primeiro termo é sı multiplicado pelo determinante de A (pelo teorema de Laplace). Os outros termos 
do lado esquerdo são zero. O lado direito é o determinante de 


bi a ce am 
AE b2 a22 a2n 

ba Qn2 ann 

Então 
sı det(A) = det(A1), 

e 

sY det(A1) 

det(A) 

O mesmo vale para os outros si. E 


Quando o determinante de A é zero, o sistema não tem solução. 
Exemplo 5.41. Considere o sistema linear 
2x, — 3x2 + 3x3 =2 


xı + x2+ x3=1 


xı — 2x2 — x3=-—2. 


Este sistema pode ser representado como Ax = b, com 


28 3 2 
A=l7 1/1) b=[ 1). 
N2 —1 "9 


O determinante de A é -13. As matrizes Ay, Az e As são 


2 —3 3 2 2 3 2-3 2 
Ar=|[ 1 1/1), Az=|1 1/1), As=|[1 1 1l; 
o EP al 1-2 —1 1 =): =9 


det(A1) = 5, det(A2) ma —3, det(A3) = —15. 


Já temos a solução para o sistema: 


e calculamos 


ae det(A1) Ea DR 
det(A) 13 
gs det(A2) = 3 
det(A) T3’ 
\ det(A3) _ 15 à 
2 det(A) 13 
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Sistemas lineares com soluções integrais 


Aqui apresentamos uma aplicação da regra de Cramer na demonstração de um teorema, que nos garante 
qua sob certas condições a solução para um sistema de equações será inteira. 


Definição 5.42 (matriz totalmente unimodular). Uma matriz A é totalmente unimodular se os determinan- 
tes de todas as suas submatrizes quadradas são iguais a 1, —1 ou 0. + 


Note que uma matriz não precisa ser quadrada para ser totalmente unimodular. Apenas exigimos que 
os determinantes de todas suas submatrizes quadradas sejam unitários ou zero. 


1101 
A=|0110 
0010 


é totalmente unimodular, porque as suas submatrizes quadradas tem determinante 1, —1 ou zero. < 


Exemplo 5.43. A matriz 


Teorema 5.44. Se A é quadrada e totalmente unimodular e b € Z”, então a solução para o sistema Ax = b, se 
existir, pertence a Z”. 


Demonstração. Se o sistema tem solução, o valor de x; é dado por 


Rr det(Ai) 
cs det(A) ` 


O determinante de A; será inteiro, porque a matriz A só tinha coeficientes inteiros, e o vetor b, que subs- 
titui uma das colunas, também. Como det(A) = +1, dividimos um inteiro por +1, obtendo x; € Z. E 


101 
A=|11 0d 
010 


totalmente unimodular, e b = (3,2,8)!. Considere o sistema Ax = b: 


von f% 3 
110] ww) =[2 
0 1 0/Axs 8 


Exemplo 5.45. Seja 


Reescrevemos o sistema, obtendo 


X1 +x3 =3 
Xı +X2 =2 
X2 =8 
Temos x2 = 8, o que implica que xı = —6. Consequentemente, x3 = 9, e a solução x = (—6, 8,9)! é 


integral. a 
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Sistemas lineares em C 


A regra de Cramer funciona em qualquer corpo, portanto podemos usá-la para resolver sistemas line- 
ares em C. 
Considere o sistema linear a seguir, com variáveis complexas. 


2ix1 —2x3 = 1 
X1 +3x2 = 0 
ix1 —X3 = 4 


O sistema pode ser reescrito como Ax = b, com 


2i 0-2 1 
A=|[13 0), b=|0 
i Oi 4 


Os determinantes são 


det A; =21i, 
det A2 = —7i, 
det A3 = —3i — 24 


A solução é, portanto, 


om Y 7i STAY 
KI 6it6 4 T HH = gN 4b 
9i — 7i 7 7: 
X2 = aN "qu TRT ab 
a —3i—24 i48 d 7; 
3 61+6 Zi+2 NOSA Ta” 


Sistemas lineares em Z, 


Damos um exemplo de resolução de sistema linear sobre Z2, usando a regra de Cramer. 
Exemplo 5.46. No exemplo 5.20) verificamos que o determinante de 


FE 
11) 


com entradas em Z2, é 1. Agora resolveremos o sistema Ax = b, com 


p=: 


Usando a regra de Cramer, 
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e temos 


Para calcular os valores de xı e x2, multiplicamos det A; pelo inverso multiplicativo de det A. Como 
det A = 1, seu inverso em Z2 é também 1. 


xı = det Aı (det A)! 


=(1)(1) 
=1, 
x2 = det A2 (det ASR 


Facilmente verificamos que 


1 
1 
= 1 (1) 81 (2) (combinação linear de colunas, sec[4.2.2) 
1 
1 


«4 


5.6.2 Área de triângulos, volume de pirâmides 


O cálculo da área de triângulos em R? a partir dos vértices pode ser descrito pelo determinante de uma 
matriz de ordem 3. 


Teorema 5.47. A área do triângulo com vértices A = (a1, a2)", B = (by, b2)!, C = (c1,c2)! édada por 


1 Aa, o al 
dee (P aq Ci “|-|; — det q E 


bz—- az c2— az 
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Demonstração. Sejam A, B, C pontos em R?. Observamos que B — A e C — A podem ser vistos como dois 
vetores com tamanho igual a dois lados do triângulo ^agc. A área do paralelogramo gerado por esses 


vetores, dividida por dois, é igual à área do triângulo. Com isso chegamos a 
T iet (e =a; CI za) ; 
2 b2 — a2 C2— Q2 

Este determinante é igual a 


(bı — a1 )c2 + (a2 — b2)c1 4 


dbz —azb1, 


o mesmo valor do determinante de ordem 3 dado no enunciado do teorema. 


Removendo o módulo da fórmula, tem-se a área com orientação (volume orientado) do triângulo: se 
o triângulo não é degenerado, os dois vetores B — A e C — A formam uma base para R2. O sinal do 
determinante nos dará a orientação destes vetores com relação à base canônica. 


Exemplo 5.48. O triângulo com vértices P = (3,4)", Q = (2,-1)!,e R = (—5, 0)", na figura a seguir, 


P 


A 


1 3 4 1 5 
Jee ( 2y —] J- = 18. 
—5 01 


tem área igual a 


«4 


O exeercício|125] pede a demonstração do Teorema que nos dá uma fórmula para o volume de 


tetraedros. 


Teorema 5.49. Sejam P, Q, R, S pontos em R? formando uma pirâmide. O volume da pirâmide é dado por 


1 1 


1 


1 


1 dx ml Px Tx — Px Sx — Px 1 Px dx Tx Sx 
E det | qu >Py Ty—Py Sy>Py || = 6 de Py qy Ty Sy 
qz — Pz Tz — Pz Sz — Pz Pz qz Tz Sz 


Assim como para triângulos, a remoção do módulo nos dará volume orientado, permitindo verificar a 


base de R? formada por Q — P, R — Pe S— P. 
Exemplo 5.50. Calcularemos o volume da pirâmide PQRS, sendo 


P= (3,1,3)! 
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x y 


De acordo como Teorema o volume é 


ww a 


1 1 
1 3 
2 4 
3324 


O sinal negativo, como visto no início deste Capítulo, é indicativo da orientação da base formada por 
(P, Q, R, S), que não é concordante com a base canônica (se trocarmos dois dos vetores de posição ao mon- 
tar a matriz, por exemplo para (P, Q, S, R), a base passará ater a mesma orientação da bae canônica, e o 
sinal passará a ser positivo). < 


5.6.3 Equação da circunferência passando por tres pontos 


Mostraremos agora como obter a equação da circunferencia que passa por tres pontos dados. começamos 
mostrando uma forma alternativa da equação da circunferência. 
Usualmente a equação da circunferência é escrita como 


(x— a}? + (y - b)? =r? 
(x? — 2ax + a°) + (y? — 2by + b?) = 7? 
x? +y? — 2ax — 2by +a? +b? — r° =0 


Multiplicamos ambos os lados por algum número « Æ 0, 
A(x? +y?) — 2Aax — 2Aby + A (a? + b? — 17) =0 
Substituindo B = —2Aa, C = —2Ab, D = A (a? + b? — 12), 


A(x? +y?) +Bx+ Cy +D =0. (5.1) 
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Teorema 5.51. Dados pontos P, Q, Rem R?, a equação da reta que passa por eles é dada por 
24y? x y 1 
2 aid 1 
det | pp “P dp |=o, (5.2) 
q TUq Xq Yq 1 
ki F y? Xr Yr l 


Demonstração. Usando a expansão de Laplace na primeira linha, o determinante é 


2 af x y 1 i 
2 y2 1 Xp Yp 
det |P TY P Ye |= ya 1) aX +Cy +D, 
xa +Y Xq Yq | Sosa 1 
X 
x? +y? X Yr l S 


que é claramente a equação de uma circunferência, conforme a equação (5.1). Para verificarmos que ela 
passa por P, Q e R, observamos que 


* O determinante de ordem 3 que aparece na expressão é a área do triângulo PQR, e portanto será 
positivo a não ser quanto os tres pontos forem colineares (quando então será zero); 


* quando substituímos as coordenadas de um desses pontos - por exemplo P, em x e y, teremos duas 
linhas iguais em (5.2),e o determinante é zero (ou seja, o ponto satisfaz a equação). E 


Exemplo 5.52. Sejam P = (1,1)',Q = (1,2)! e R = (3,3)T. De acordo com o Teoremaf5.51| a circunfe- 
rência passando por estes pontos é 


x? + x y 1l x +y x y 1 
det [1412 111] Kat zhi iis 
14#27 1 2 1 5121 
2+32 3 3 1 18 3 3 1 
o que nos dá 
2(x? +y?) + 10x + 6y —12=0 
(x? +y?) —5x—3y+6=0 (dividimos por —2) 
(x — 5x) + (y? —3y)+6=0 
25 9 25 9 
2 | | 2 | | | — 
(x 5x 4 7) H (s 3y 4 z) t64 | 7 j =0 (completamos quadrados) 
M 5, 
E A co E E i 


Concluímos que a circunferência que procuramos tem centro (5/2, 3/2) e raio 1/5/2. Verificamos que os 
três pontos de fato estão na borda da circunferencia: 


(1-5/22+(1=-3/2)2 -5/2=9/441/4-5/2=0 
(1-5/22+(2-3/2)2 — 5/2 = 9/4 + 1/4—5/2=0 
(3 — 5/2)? + (3 — 3/2)? — 5/2 = 1/4 + 9/4 —5/2=0 


A figura a seguir ilustra a circunferencia e os pontos P, Q e R. 


204 CAPÍTULO 5. DETERMINANTES 


R 
3 
2 
Q 
1 
P 
1 3 


A circunferencia da figura tem o centro e raio que determinamos, e vemos que ela passa pelos tres pontos 
dados. « 


5.64 O Teorema do Valor Médio (generalizado) 
Relembramos do Cálculo o Teorema do Valor Médio. 


Teorema 5.53 (do valor médio). Seja f uma função contínua no intevalo [a, b] € R, e diferenciável em (a, b). 
Então existe c € (a, b) tal que 
f(b) — f(a) 
b—a 
Há uma generalização deste Teorema para duas variáveis. Esta forma mais geral é chamada de “Teorema 
do Valor Médio de Cauchy”, ou “Teorema do Valor Médio Generalizado”. 


= f'(c). 


Teorema 5.54 (do valor médio, generalizado). Se f e g são contínuas no intevalo [a,b] € R, e diferenciáveis 
em (a, b), com g(a) Æ g(b), então existe c € (a, b) tal que 

f(b)=f(a) _ f'(c) 

g(b)—- gla) g'(c)' 


Demonstração. Seja 


Claramente, H é zero quando x = a e quando x = b, porque isto implicaria em duas colunas iguais no 
determinante da direita. 
A função H vale 


H(x) = [f(x) — f(a)] [9(b) = g(a)] — [f(b) — f(a)] [g(x) — g(a)] 
So FOR. s 


= Af(x) — Af(a) — Bg(x) + Bg(a) 
= Af(x) — Bg(x) + k, 


e como f e g são diferenciáveis e k é constante, H é diferenciável. 
Temos agora dois fatos: 
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i) H(a) = H(b) = 0; 


ii) H é diferenciável em (a, b). 
Pelo Teorema do valor médio, (i) e (ii) implicam na existência de um ponto c € [a, b] tal que 


b-a 


ou seja, há um ponto no intervalo onde a derivada de H é zero. 
A deerivada do determinante de ordem dois é fácil de calcular: a variável x aparece apenas na primeira 


coluna, portanto derivamos esta coluna: 


Wo) = dlt Pao 
o (go) g(b) — gla) 


Como o enunciado nos garante que g(a) # g(b), substituímos c em x e temos 


fc) [g(b) —gla)] = g(c)[f(b) — f(a)) = 0 
f'(c) > f(b) — f(a) = 
g'(c) g(b)-— g(a)" 
Exemplo 5.55. Sejam f(x) = x? e g(x) = yx em [0,4] 
42 — 02 £e? 
va- deve 
16 2c 
2 eye 
2 
“= Ve 
do 
Al 
c= 16 


No entanto, nem sempre é possível determinar c assim facilmente. < 
O Teorema do Valor Médio de Cauchy pode ser usado para demonstrar a validade da regrade L Hôpital. 
A seguir esboçamos esta demonstração. 
Teorema 5.56 (regra de LHôpital). Sejam f e g contínuas no intevalo [a, b] € R, e diferenciáveis em (a, b), com 
g'(x) £ 0 para todo x € (a,b). Sejac € (a,b), com f(c) = g(c) = O. Então 


se o limite no lado direito da equação existir. 
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Demonstração. (Esboço) 

Usamos o Teorema do Valor Médio de Cauchy, mas ao invés de fixar um intervalo [a, b], variamos o 
limite superior, e denotamos nosso intervalo por [a, x]. 

Assim, fixado a e definido algum x > a, sabemos que existe algum c € [a,x] tal que 


Mas se f(a) = g(a) = 0, então 


Agora aproximarmos x de a. Claramente, quando x — a, temos c — a também, porque c deve estar no 
intervalo [a, x]. Assim, 


Pa pm EO 
xo ar g'(c) xa + g'(x) 
f'(x) 


f(x) “(x 


( 
lim —— = lim —+, 
x5a+ g(x) x a+ g'(x) 


Repetimos o mesmo raciocínio para o limite pela esquerda, tomando intervalos [x, b] e fazendo x > b. W 


5.6.5 O Wronskiano 


Suponha que queiramos determinar se um conjunto de funções é linearmente independente em um certo 
intervalo. 


Definição 5.57 (Wronskiano). Sejam f1, f>,..., fn funções em C7! [a, b], ou seja, n — 1 vezes diferen- 
ciáveis em um intervalo [a, b]. O Wronskiano deste conjunto de funções é o determinante 


fı f2 fn 
fi f3 fa 

det e f} 4 + 
rD Rosa gn) 


Exemplo 5.58. Sejam f(x) = x? e g(x) = cos(x). O Wronskiano das duas funções é 


2 

det [f 9 \=det (* cos{x) | — —x? sen(x) — 2x cos(x). 
f g’ 2x —sen(x) 

Vemos claramente que o Wronskiano, sendo obtido por soma, subtração e multiplicações de funções, tam- 

bém é uma função de x. < 


Teorema 5.59. Sejam f1, f2, . . ., fn funções n — 1 vezes diferenciáveis em um intervalo [a, b]. Se o Wronskiano 
destas funções é diferente de zero para algum x € [a,b], então as funções são linearmente independentes nesse 
intervalo. 
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Demonstração. Suponha que f1, . . ., fn sejam LD. Então existem ay, ..., an tais que 
ufy+Hatfo+---+anfn=0. 


Derivamos ambos os lados n — 1 vezes, obtendo 


aifi +a2ff + + anfa =0 
a fY H azfy eis anf? =0 


mt t aats Potato = 0 


Ou seja, se as funções forem LI este sistema pode ter apenas a solução trivial com todos os a; = 0. Isso é 
o mesmo que dizer que o determinante da matriz de coeficientes do sistema - o Wronskiano - é zero, para 
todo x. E 


Exemplo 5.60. No exemplo[5.58lverificamos que o Wronskiano de f(x) = x? e g(x) = cos(x) é 
P p q g 


W(x) = det (x O) = —x? sen(x) — 2x cos(x). 
2x —sen(x) 


Escolhemos, por exemplo, x = 7, e obtemos 


Wim) = =n? sen(m) — 27 cos(7) 
= —2n(—1) 
=2m. 
Como W(7) Æ 0, então as funções não são LI em R. « 


Exemplo 5.61. Considere as funções f(x) = 2x, g(x) = ln(x) e h(x) = xIn(x). O Wronskiano destas 
funções é 
2x xlIn(x) ln(x) 
det | 2 In(x)+1 1/x |» 
0 1/x al? 
que é igual a 
2In(x) 2 4ln(x) 


X X X 


Multiplicamos a expressão por x e igualamos a zero, obtendo 


—2In(x) -2+4In(x) = 0 
2In(x) —-2=0 
1 


In(x) = 
x=e 
Assim, o Wronskiano só é zero em x = e, e as funções são LI em qualquer intervalo de R. < 


Se as funções são LD, o Wronskiano não pode ser diferente de zero em nenhum ponto do intervalo. 
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Exemplo 5.62. As funções f(x) = x? e g(x) = —3x? são evidentemente LD (uma é múltipla da outra). 
Calculamos seu Wronskiano: 
2 2 
W(x) = det(X =3x% }] = —6x3 — 6x? = 0, 
2x —6x 
e como esperávamos, o Wronskiano é zero para todo x € R. < 


Observe que somente provamos que se o Wronskiano é diferente de zero em algum ponto do inter- 
valo, as funções são LI. A recíproca não é necessariamente verdadeira: quando o Wronskiano é zero em 
todo o intervalo, nada podemos afirmar sobre a dependência linear das funções. Este fato é ilustrado no 


exemplo 


Exemplo 5.63. As funções x e |x| são linearmente independentes: presuma que existem constantes a e b 
tais que 
ax + b|x| = 0. 
Para x = —1, teríamos —a = b. Para x = 1, teríamos a = b. Assim, b = a = —a, o que só é possível com 
ambos iguais a zero. 
No entanto, apesar das funções serem LI, seu Wronskiano é 


det k E sy . 
Ped 


Quando temos dados experimentais a respeito de algum fenômeno, mas ainda não temos um modelo ma- 
temático para ele, podemos usar esses dados para construir Interpolar significa determinar uma função que 
passe por um conjunto de pontos dados. 

Se tivermos valores (xo, yo), (X1,U1),. - ., (Xn, Un), podemos determinar um polinômio de grau menor 
ou igual a n passando exatamente por esses pontos. 


5.6.6 Interpolação 


Definição 5.64 (Matriz de Vandermonde). Uma matriz de Vandermonde é uma matriz quadrada cujas colu- 
nas ou linhas formam uma progressão geométrica. Construímos uma matriz de Vandermonde a partir de 


n escalares da seguinte forma: dados ko, k1, . . . kn diferentes entre si, 
1 ki k? pau ki! 

Viko kY.. kn) = |L *2 kå o k! , 
Uh e o i 


Exemplo 5.65. As matrizes a seguir são matrizes de Vandermonde: 


1 1 12 4/8 1 a al až as 

A= B=/1 5 25 125 C=|1 a a aœ a 
É o a) 13 9 27’ 1 b b b b’ 

1 7 49 343 1 b? bê b? b!? 


onde, na matriz C, a Æ b. 
A matriz A tem os escalares —1, 2 e 10 elevados às potências 0, 1,2 em cada linha. A matriz B tem 
2,5, 3,7 elevados às potências 0, 1,2,3. A matriz C tem a, (a2), b, (b3) elevados às potências 0, 1,2,3. « 
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O Teorema|5.66)nos dá uma maneira simples de calcular o determinante de matrizes de Vandermonde. 
Sua demonstração é pedida no exercício 


Teorema 5.66. Seja A uma matriz de Vandermonde V (ko, . . . kn), ou seja, 


1 ky kê o kK! 
1 k2 ss Em 
A = V(ko, k1, ..., Kn) = . É a j 
Teka kè o k! 


Então 
det(A) = Ts E ki). 


i<j 


Exemplo 5.67. O determninante da matriz A do exemplof5.65] 
1 —1 1 

dl 2 4 
1 10 100 


detA = +(1)(2)(100) + DDD) HAND 
1 


é facilmente obtido pela regra de Sarrus: 


= 264. 


Mas sabemos que esta é uma matriz de Vandermonde, com 


ko = —1 
kı =2 
k2 = 10 


Seu determinante, portanto, é 


det A = (kı — ko) (k2 — ko) (k2 — kı) 
(2 — [=1] IO — [-1])(10 — 2) 
(3)(11)(8) 

264. 


Observe que ao aplicar a regra de Sarrus, fizemos 3 somas, 3 subtrações, e 12 multiplicações. Usando o 
teoremaf[5.66 fizemos somente 3 subtrações e duas multiplicações. Para matrizes de ordem maior, o uso 
deste teorema é ainda mais vantajoso. < 


Usamos a relação entre determinante e a existência de solução para um sistema linear na demonstração 


do teorema 


Teorema 5.68. Dados n + 1 pontos, existe um único polinômio de grau menor ou igual a n que passa por todos eles. 
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Demonstração. Para encontrar o polinômio interpolador 
ylx)=ao+ax+---+anx” 


escrevemos, em notação matricial, 


Xo Xo vo Xo ao yo 
1 x xi ee xT q | |Y 
1 2... n a E 

Xn Xn Xn n Yn 


Temos então um sistema linear, 


3 2 
a3Xo + d2Xg T Q1Xọo + do = Yo 


3 2 
a3x] + 2X] + G1X1 + 1 = Y1 


3 2 
Q3X5 + d2X5 + d1X2 + do = Y2 


3 2 
Qa3X3 + QA2X3 T QA1X3 T A3 = Y3. 


Os pares (xi, yi) são dados (são os pontos que usamos para interpolar), e as incógnitas são os coeficientes 
ai. Como os x; são todos distintos, o determinante da matriz de coeficientes - que é uma matriz de Van- 
dermonde - é sempre diferente de zero, porque det(A) é o produto de diferenças entre x;, x; distintos, e o 
sistema terá uma única solução não nula que descreve o polinômio interpolador. E 


Exemplo 5.69. Os pontos a seguir poderiam ter sido obtidos de algum experimento, e acreditamos poder 
descrever a relação entre as duas grandezas por um polinômio. 


—5,-78) 
—1, —14) 
1,6) 
10, —3) 
Usando o que foi exposto anteriormente, temos 
1 —5 (5)? (—5)°\ /ao —78 
1 1 (€12 (18 | banho |-14 
1 1 12 13 a2 6 
1 10 10? 10/43 -3 
A solução do sistema é ao = —3, aı = 10, a2 = —1,e az = 0. Como az = 0, verificamos que um dos 


pontos era desnecessário - ou seja, uma parábola é suficiente para descrevê-los: 


y =x? + 10x—3 « 


Exercícios 


Ex. 123 — Calcule os determinantes das matrizes a seguir. 


E 2 1 AMA a b cil S T 
E 4 AS 2 b 0 02 2 1 3/2 5 

ZO É 2—2 3 c 0 03 0 3 3/2 4 
Toc e2 d —2 —3 4 Et 0-7 


5.6. APLICAÇÕES 211 


2 3 7-1 0 
22 12 3/2 15 -2 
51 6 14 —2 0 
10 3 3/2 34 —2 

—9 16 0 0 0 


Ex. 124 — Determine a tal que o volume do paralelepípedo gerado pelos vetores (0, a,2a)!, (1,0,1)! e 
(4,4,-2)! em R? seja 1. 


Ex. 125 — Prove o Teoremal5.49] 


Ex. 126 — Verifique que a fórmula que demos para determinar uma circunferência passando por dois pon- 
tos é naturalmente generalizada para quatro pontos e esferas. Depois demonstre que vale a generalização 
para n + 1 pontos e hiperesferas em R”. 


Ex. 127 — A fórmula para determinar a circunferência passando por tres pontos dá a equação daquela 
circunferência a partir de um determinante 


det (+ ) =A(x? +y?) +Bx+Cy+D=0, 
que depois pode ser transformada na forma usual, 
(x— a)? + (y — b)? =r. 
Prove que aquele determinante nunca resultará em uma equação de circunferência com raio negativo. 


Ex. 128 — Prove o Teorema[5.16] 


Ex. 129 — Revise anotação que usamos para matrizes elementares e calcule os determinantes das matrizes 
a seguir. Diga também de que ordem, no mínimo, devem ser as matrizes para que as expressões façam 
sentido. A, B, C são matrizes, e k é escalar. 


i) det [E2117] 

ii) det [E>,3E3,4E3r2A] 
iii) det [E1 2E3 4E211 AE2,3B(5C)] 
iv) det [E2+314A(3B)E1,2C] 

v) det [E411 A(kB)E3,1ı (4C—")] 
vi) det [k-! AExı2B] 


Ex. 130 — Resolva usando a regra de Cramer: 


=% j TXT X4 = 1 
xı +Xx2 +x3 = 0 xı + X2 =0 
x1 + 3x2 +x3 + x4 =2 
(a) 4 xı +x2—x3=1 (b) x2—x3=1 (c) 
X2 T X3 = 
xı — X2 + X3 =—] 2x13x3 =2 
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Ex. 131 — Seja A uma matriz quadrada com det A = d, e A’ = P1 P2.. . PKA, onde cada P; é uma matriz 
que permuta duas linhas adjacentes. Relacione o determinante de A’ com k. 


Ex. 132 — Demonstre o Lemal5.8] 
Ex. 133 — Demonstre o Teorema[5.12| 


Ex. 134 — Considere a operação de reversão de colunas em matrizes quadradas: a matriz (a1,a2,...,an) 
tem suas colunas listadas na ordem reversa, (an, Ano - -N Je Diga qual é o efeito desta operação no 
determinante de uma matriz, e apresente uma demonstração. 


Ex. 135 — A operação de reversão de colunas, exposta no exercício é linear? 


Ex. 136 — Sejam A e B duas matrizes quadradas de ordem n, tais que A e B não tem entradas não-nulas 
em comum. Em que situação é possível termos det À = det B? 


Ex. 137 — Prove o Teoremal5.25] 

Ex. 138 — Se sempre tomarmos o módulo do determinante de uma matriz, teremos uma função que dá 
o volume sem sinal - seria então diferente da função determinante que desenvolvemos neste Capítulo. 
Explique porque esta função não é uma função determinante, e não contradiz, portanto, a unicidade da 


função determinante. 


Ex. 139 — Seja T(x,y,z)! = (2x,y,y — z). Prove que a matriz 


1 0 3 
2 1 0 
2 O —6 


não pode representar T, em nenhuma base de Rê. 
Ex. 140 — O triângulo de Pascal pode ser definido da seguinte forma: 


Na primeira linha temos “1”. 


Nas linhas seguintes, cada elemento é a soma do elemento acima dele com o que está acima e à es- 
querda. 


++ = —d dd —d —a 


O triângulo de Pascal pode ser naturalmente disposto na forma de matriz. Podemos, pode exemplo, definir 


5.6. APLICAÇÕES 213 


as matrizes Bn, Cn e Pa. 


1000 1111 11 1 1 
B4=|1 100 Ee os as Pr= [1/2030 4 
1210 0013 13 6 10 
rsss 0001 1 4 10 20 
10000 11111 11 1 1 1 
11000 01234 12 34 5 
Bs=|12100 C5=|00136 Ps=ļ|1 3 6 10 15 
13310 00014 1 4 10 20 35 
14641 00001 1 5 15 35 70 


a) Prove que det Pa = 1. 
b) Prove que se a matriz K tem todas as entradas iguais a um valor k, det(Pn + K) = 1 +k. 


c) Mostre que as matrizes Pn são parte de uma família de matrizes tais que det(A+K) pode ser calculado 
com apenas três operações aritméticas, desde que se conheça det A. 


Ex. 141 — Na definição informal de orientação em Rº, alinhamos o último vetor da base com e3. Mostre 
que se tivéssemos alinhado com qualquer vetor não-nulo, as bases com orientação concordante seriam as 
mesmas. 


Ex. 142 — Seja À uma matriz 3 x 3 com coeficientes em Q. Mostre que se d é um inteiro positivo tal que 
dlaj1 012013, dlaz1 022023, d|a31 32033, então d| det(A). 
Ex. 143 — Demonstre o teorema de Sylvester: se A én x k,e B ék x n, então 


det(Zn + AB) = det(Z, + BA). 


Ex. 144 — O permanente de uma matriz é uma função semelhante ao determinante, com uma diferença: 
na fórmula de Leibniz, retiramos a multiplicação por sgn(o). Que propriedades de determinante o perma- 
nente também tem? E para que matrizes reais o permanente é igual ao determinante? (Tente caracterizar 
as matrizes sem usar permutações.) 


Ex. 145 — O permanente de uma matriz sempre será igual ao determinante quando as entradas pertence- 
rem a um certo corpo. Qual? 


Ex. 146 — Quais matrizes anti-simétricas são singulares? 


Ex. 147 — Considere o conjunto das matrizes diagonais de ordem n. Defina a operação & como 
A QB = det(AB)Z 

O conjunto das matrizes diagonais de ordem n com as operações de soma de matrizes e & é um corpo? Se 
não for, há como impor restrições adicionais sobre as matrizes para que obtenhamos um corpo? 
Ex. 148 — Determine a para que os triângulos A, e Az, cujos vértices são dados a seguir, tenham a mesma 
área. 

^l JB, 1 jr (0, a)', (2,5)" 

Az (1 , a =] , —4)", (0, 0)" 
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Ex. 149 — Considere as três funções f(x) = x, g(x) = e* e h(x) = e7* em Cº, Responda: 
“Estas funções são LI ou LD em R? 
*E em algum intervalo qualquer [a, b] CR? 


Ex. 150 — Em que intervalo as funções são LI? 
i) cos(e*) e sen(e”). 
ii) f(x) = 1, g(x) =x e h(x) = ex, 


iii) x* e e*. 


Ex. 151 — As funções f(x) = sen? (x), g(x) = cos?(x) e h(x) = 2 são LD (prove!). Verifique que seu 
Wronskiano é zero. 


Ex. 152 — Para pontos (x0, Yo), .. ., (Xn, Un), sempre é possível encontrar um polinômio interpolador de 
grau menor ou igual an. Determine uma fórmula para os coeficientes deste polinômio (para que não seja 
necessário resolver o sistema linear exposto na seção 


Ex. 153 — Calcule o determinante da seguinte matriz, cujas entradas pertencem a Z2. Reveja as operações 
usadas no exemplo (página[s). Lembre-se de que cada elemento é seu própio inverso aditivo, portanto 
a+b = a — b, que denotamos simplesmente por a & b. 


110 
011 
100 


Ex. 154 — Prove que se uma matriz tem todas as entradas pertencentes a um corpo, seu determinante será 
necessariamente um elemento do mesmo corpo. 


Ex. 155 — Seja A uma matriz com entradas inteiras. Determine em que situação A pode ter inversa tam- 
bém com entradas inteiras (lembre-se que os inteiros não são um corpo e por isso, de maneira geral, A 


ED NA +1/2 +1/2 
pode ter inversa com entradas não inteiras: tome por exemplo (7 41 i a x A ). 


), cuja inversa é ( 


Ex. 156 — Resolva o sistema em Z2, usando a regra de Cramer: 


X1 X2 x3 = 0 
x E xz =1 
Xx2 © X3 = 


Ex. 157 — No exercício[56| mostramos como representar números complexos como matrizes de ordem 2. 
Se f(a + bi) = A, quem é det A? 


Ex. 158 — Para que uma matriz seja totalmente unimodular, que valores ela pode ter em suas entradas? 


Ex. 159 — No teorema mostramos que se A é quadrada e totalmente unimodular, e b é integral, a 
solução para Ax = b é integral. Sabemos que se A não for quadrada, com mais colunas do que linhas, 
o sistema tem infinitas soluções. Reescreva o teorema para este caso. Todas as soluções serão inteiras? 
Parcialmente inteiras? 
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Ex. 160 — Há espaços vetoriais de dimensão finita onde todas as bases tem a mesma orientação. Quais são 
estes espaços? 


Ex. 161 — Transformações lineares preservam volume? 


Ex. 162 — Definimos a seguinte família de matrizes: 


D> 
w 
II 
o E ES 


1 -1 Pd 
aci RIO 
“lo dd Y- 
0.0 1 
11 0 0 0 0 0 
1 11 0 0 0 O 
O 1 1-1 0 0 0 
aPN o 1 DN 0 0 
alo o 0 1 0 0 


Ou seja, An tem uns na diagonal principal e imediatamente abaixo dela; e tem —1 imediatamente acima 
da diagonal. 


Seja (an) a sequência definida pelos determinantes destas matrizes. Determine a forma fechada para an. 


Ex. 163 — Proveo Teoremaf5.37 


Ex. 164 — Diga se as estruturas a seguir são grupos, quando usada a operação de multiplicação de matrizes: 
i) As matrizes A de ordem n com det A = 0; 
ii) As matrizes A de ordem n com det A = 1; 
iii) As matrizes A de ordem n; 
iv) As matrizes A de ordem n com determinante ímpar; 
v) As matrizes A de ordem n com determinante par; 


vi) As matrizes A de ordem n não-singulares. 


Ex. 165 — Prove o Teoremal5.66] 
Ex. 166 — Os seguintes pontos foram obtidos em um experimento: 


(—3, —8) 
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(1,20) 
(13, —65) 
(20,9) 


Presumimos que estes pontos são descritos por um polinômio. Determine, portanto, um polinômio que 
passe por todos eles. 


Capítulo 6 


Autovalores, Autovetores e 
Diagonalização 


Se a matriz de um operador linear T não é diagonal, muitas vezes podemos encontrar uma base diferente 
da canônica em que a matriz de T é diagonal. Isso traz diversas vantagens, como veremos mais adiante. O 
processo de determinar as matrizes de mudança de base a fim de obter uma representação diagonal de um 
operador é chamado de diagonalização - este é o tema deste Capítulo. 
Considere o operador linear 
T= F 9) : 
02 


Temos portanto T(x, y)! resultando no vetor (—x, 2y)". Há dois conjuntos de vetores interessantes rela- 
cionados a este operador: os que ficam na reta x = 0 e os que ficam na reta y = 0. 


O operador T leva estes vetores em seus múltiplos. De maneira geral, um operador linear não leva qualquer 
vetor em um múltiplo seu. Quando isto acontece, dizemos que este é um autovetor do operador. 

Os vetores da forma (x, 0)", como v na figura, são autovetores da transformação, e dizemos que eles 
pertencem ao autovalor —1, porque T(x, 0)" é igual a —1 (x, 0)". Já os vetores da forma (0, y)", como o vetor 
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w na figura, são também autovetores da transformação, mas pertencem ao autovalor 2, porque T(0,y)! = 
2(0,y)". 


Definição 6.1 (Autovetor e autovalor). Seja A um operador linear em um espaço vetorial V sobre um corpo 
F. Um vetor v Æ 0 é um autovetor de A se e somente se existe um escalar À € F tal que Av = Av. O escalar 
A é um autovalor de A, associado ao autovetor v. 

O conjunto dos autovalores de um operador é o seu espectro. + 


Ta 


são os autovetores pertencentes ao autovalor —3. 


Exemplo 6.2. O operador 


tem autovalores —3 e 2. 
Os vetores da forma (a, 5a 


E a) ÉS = (A g) a E a É) : 


A figura a seguir ilustra geometricamente a atuação de T sobre estes vetores. 


Es 


Tv=—3v 


Os vetores da forma (b, 0)" são os autovetores pertencentes ao autovalor 2. 


C =) =2(3). 


A figura a seguir ilustra geometricamente a atuação de T sobre estes vetores. 
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A mesma interpretação geométrica fará sentido em Rº, e de maneira geral, em R”. « 


Da mesma forma que definimos posto e nulidade similarmente para transformações e matrizes, tam- 
bém o fazemos para autovalores e autovetores: os autovalores e autovetores de uma matriz são os mesmos 
da transformação que ela representa. 

4 0 
0 —1 


tem autovalores —1 e 4. O autovetor (0, 1)! é associado ao autovalor —1 e o autovetor (1,0)! associado ao 


autovalor 4, porque E 9 (9) : (9, a 9 (3) de o. 


Estes não são, no entanto, os únicos autovetores deste operador. É simples verificar que múltiplos de au- 
tovetores também serão autovetores. < 


Exemplo 6.3. O operador 


Exemplo 6.4. O operador 


tem somente o autovalor 1. Os autovetores associados a este autovalor são todos os vetores da forma 
T 
(x, —x) 


A(x, =x)" = (x, =x)". < 


Exemplo 6.5. O operador 


não tem autovalores reais (mas tem autovalores complexos - veremos adiante que, apesar de um operador 
em R” nem sempre ter autovalores reais, sempre terá autovalores complexos). « 
Exemplo 6.6. Seja C% o espaço das funções contínuas e infinitas vezes diferenciáveis. A derivada segunda, 
d? /dx?, é um operador linear neste espaço. Um autovetor deste operador é a função seno, já que 
d2 
— sen(x) = — sen(x) 
dx? ? 


e o autovalor associado a este autovetor é —1. < 


Exemplo 6.7. No espaço C%°, das funções reais contínuas e infinitas vezes diferenciáveis, a função f(x) = 
e* é um autovetor da transformação definida pela derivação, porque 


Ve 
dx 


x = ex. 


O autovalor de e* neste espaço é 1. 
Já a função g(x) = e?* é autovetor da operação de derivação, com autovalor 2, porque 


= = 2e”): 
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A operação de derivação tem infinitos autovalores e autovetores: para todo k € R, k é autovalor do auto- 
vetor elx, 
Como a solução geral da EDO y’ — ky = 0 é y = ce**, então dado um k € R, para todo c € R, 


y=ce 
é autovetor associado ao autovalor k. « 
Exemplo 6.8. No espaço R2[x], considere o operador 

T(ao + ax + ax?) = 2a9 + 3aıx + 2a2x?. 
Este operador tem dois autovalores, 2 e 3. 


* Os autovetores do autovalor 2 são os polinômios da forma ao + azx?, porque T levará cada um deles 
ao seu dobro, 


T(ao + ax?) = 2ao + 2a2x? = 2(ao + dx). 


* Os autovetores do autovalor 3 são os polinômios da forma ayx, porque T levará cada um deles ao seu 
triplo: 
T(aıx) = 3(a1x). « 


Exemplo 6.9. Em Z2 temos apenas dois escalares, O e 1. Assim, o único autovalor que um operador pode 
ter é 1. Por exemplo, o operador 


tem autovalor 1, com autovetor 


Verificamos: 


Lema 6.10. Seja A um operador com autovetores V1, V2, ..., Vk e autovalores Ay, A2, ..., Ax. Se os autovalores A; 
são distintos, então os autovetores são linearmente independentes. 


Definição 6.11 (subespaço próprio). Sejam V um espaço vetorial, T um operador linear em V e À um 
autovalor de T. Então os autovetores relacionados a À formam um subespaço, chamado de espaço próprio 
(ou autoespaço) de V. 


O Exercício[167)pede a demonstração de que o espaço próprio é realmente subespaço de V. 
A quantidade de autovetores linearmente independentes tendo À como autovalor associado é sua mul- 
tiplicidade geométrica, que também podemos definir da seguinte maneira. 


Definição 6.12 (multiplicidade geométrica de autovalor). A multiplicidade geométrica de um autovalor À é 
a dimensão de seu espaço próprio. + 
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Exemplo 6.13. Considere a matriz 


1 —2 0 
—2 1 0)- 
O 03 
Esta matriz tem autovalores 3 e —1. 


O autovalor 3 tem como autovetores associados os vetores da forma 


que são combinações lineares de vetores 


Já o autovalor —1 tem autovetores da forma, 


c 
c 
0 
O espaço próprio do autovalor 3 é gerado por dois vetores, (1, —1,0)" e (0,0, 1)T, portanto sua dimensão 
é dois. 
O espaço próprio do autovalor —1 é gerado por um vetor, (1,1,0)", portanto sua dimensão é um. 


Ou, equivalentemente, a multiplicidade geométrica do autovalor 3 é dois. A multiplicidade geométrica 
do autovalor —1 é um. «4 
Exemplo 6.14. Como já exposto no exemplof6.8| em Rz [x], o operador dado por 
T(ao + ax + a2x?) = 2aọ + 3aıx + 2a2x?. 
tem autovalores 2 e 3. 


* Os autovetores do autovalor 2 são os polinômios da forma ao + azx2. Estes polinômios formam um 
subespaço de dimensão dois, porque são gerados pelos dois polinômios 


2 
(1,xº). 
* Os autovetores do autovalor 3 são os polinômios da forma ax. Estes polinômios formam um subes- 
paço de dimensão um, porque são gerados pelo polinômio x. < 
Teorema 6.15. Seja A com autovetor v e autovalor associado À. Então v e AT! são autovetor e autovalor de A |. 


Demonstração. Se Av = Av, então 


Av = Àv 
v = AT! (Av) (multiplique por A7!) 
v=AA lv 
Aly =A |v, (multiplique por A7!) 


portanto v é autovetor de A7! com autovalor |. E 
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Corolário 6.16. Se O é autovalor de A, então A é singular. 


Exemplo 6.17. Seja 


tem autovaloresA, = 1eAz =3. 


* Os autovetores de Ay = 1 são da forma (x, x)": 


C I C) 


* Os autovetores de A, = 3 são da forma (x, —x)": 


A inversa de A é 


com autovaloresny = 1 e n2 = 1/3: 


* Os autovetores den = 1 são da forma (x, x)": 


sG DO 


* Os autovetores dem, = 1/3 são da forma (x, —x)!: 


TO 


Exemplo 6.18. A matriz singular 


tem autovalores Ay = 0 e Az = —5. 


* Os autovetores de A, = 0 são da forma (x, —2x)!: 


e 3) Ren = E = 


* Os autovetores de Ay = —5 são da forma (x, —x/3)!: 


6-0) à 


Proposição 6.19. Se A não é singular, os autovalores de A e AT são os mesmos. 


O traço da matriz de um operador linear é a soma de seus autovalores. Já o determinante da matriz é o 
produto dos autovalores. 


6.1. POLINÔMIO CARACTERÍSTICO 223 


6.1  Polinômio característico 


O polinômio característico de uma matriz nos permite determinar seus autovalores, e consequentemente 
seus autovetores - e é uma importante aplicação de determinantes. 
Se x e À são um par de autovetor e autovalor de uma transformação A, então por definição 


AX = ÀX. 


Queremos encontrar valores para À e x, com x Æ 0. 
Podemos reescrever esta equação, já que Ax = AZx. 


Ax = ATx. 
Temos então 
AZx— Ax = 0 
(AZ — A)x =0. 


Se (AZ — A) não for singular (ou seja, se seu determinante for diferente de zero), o sistema acima terá 
somente uma solução, com x = 0, porque 


(AZ — A)x=0 
x=(AZ-AJ!o (AZ — A não singular — sua inversa existe) 
x=0. 


Como queremos as outras soluções, com x 4 0, estamos procurando valores de À para os quais a matriz 
(AZ — A) é singular 
det(AZ — A) = 0. 


Esta equação é chamada de equação característica. e seu lado esquerdo é chamado de polinômio característico. 


Definição 6.20 (Polinômio característico). Seja A um operador em R” (ou uma matriz quadrada de ordem 
n), com elementos de um corpo F. O polinômio característico de A é 


det(xT — A). + 


As raízes do polinômio característico de uma matriz A são os autovalores da transformação represen- 
tada por A. 

Note que poderíamos ter definido o polinômio característico como (A — AT) ao invés de (AZ — A). Che- 
garíamos ao mesmo polinômio característico, com sinal trocado. As raízes, no entanto, seriam as mesmas. 


Exemplo 6.21. O polinômio característico do operador 


202 
A=ļ|0 01 
100 


é det(xZ — A), ou 
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x—2 0 —2 
=det 0 x 1] =x -2x — 2x. 


— 0 x 


As raízes deste polinômio são 0, V3 + 1 e 1 — v3. Estes são também os autovalores da transformação 
representada pela matriz A. < 


No último exemplo, o polinômio característico da matriz de ordem 3 era mônico (o coeficiente de x? 
era 1) e de ordem 3. Na verdade, isto sempre acontece, conforme o Lemaf6.22) cuja demonstração é o objeto 
do Exercício[174 


Lema 6.22. O polinômio característico para uma matriz quadrada de ordem n sempre será mônico e de grau n. 


No entanto, o polinômio característico de uma matriz de ordem n não necessariamente terá n + 1 
termos. 


Exemplo 6.23. O polinômio característico da matriz 


o 


2 — x — 1, com três termos. Já o polinômio característico de 


éx 


é x? — 2x - tem apenas dois termos. < 


O traço e o determinante de uma matriz podem ser obtidos diretamente de seu polinômio caracetrístico, 
como determina o Teoremagf6.24] cuja demonstração é pedida no Exercício 


Teorema 6.24. Seja 
anx” Lanax T+... +a1x + ao 


o polinômio característico de uma matriz M. Então 


an-ı =—(—1)"TrM 
ao = detM 


Corolário 6.25. Uma matriz é singular se e somente se o seu polinômio característico não tem termo independente. 


Exemplo 6.26. O polinômio característico da matriz 


(2 3) 


é x? — 8x. Como a matriz é simgular (a segunda linha é obviamente múltiplo da primeira), o determinante 
(o termo independente do polinômio característico) da matriz é zero. < 
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Exemplo 6.27. O polinômio característico da matriz 


Ga 


é x? — 3x — 2, e percebemos claramente também que Tr A = 3 e det A = —2. 
Já o polinômio característico da matriz 


é —x? — 10x — 14. O determinande de B é 14, e seu traço é zero. 
Como último exemplo, considere a matriz identidade de ordem n. Seu polinômio característico é 


T-x 0 peee 0 


dt) 0 15x. =(1-5" 


=(-D Px! +...— ax +1, 


e temos portanto o traço n e o determinante 1 nos coeficientes do polinômio característico. Concreta- 
mente, o polinômio característico de Ty é 


(1=x)f =x — 4x? + 6x? —4x + 1, 


com Tr T4 = —(—1)*(-4) = —(-4) = 4,e o de Ts é 
(1 =x)? = —x7 + 5x4 — 10x? + 19x2 = 5x + 1, 
com Tr Z5 = —(=17)5 = —(—1)5 = 5. < 


Definição 6.28 (Multiplicidade algébrica de autovalor). A multiplicidade algébrica do autovalor A é sua mul- 
tiplicidade enquanto raiz do polinômio característico de A. + 


Exemplo 6.29. O polinômio característico do operador 
"D 
03 


x —6x+9=(x—3), 


Ox 


que tem duas raízes idênticas (a parábola toca o eixo horizontal exatamente uma vez), iguais a 3. A multi- 
plicidade algébrica do autovalor 3 é, portanto, dois. « 


Método 6.30 (Determinação de autovalores e autovetores). Para determinar os autovalores e autovetores 
de uma matriz A, primeiro obtenha o polinômio caractetrístico de A. As raízes deste polinômio são os 
autovalores de A. 

Depois, resolva Av = Av, para todos os autovalores À, obtendo assim os autovetores de A. ) 
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Exemplo 6.31. Já calculamos no exemplo o polinômio característico da matriz (3 1), que é igual a 
(x — 3)2, tendo duas raízes iguais a 3. 
Para determinar os autovetores da matriz, resolvemos 


AX = 3x 
AR 
03 X2 3x2 


3x1 + x2 = 3x1 
3x2 = 3x2 * 


O sistema que queremos resolver é 


que é indeterminado e tem como soluções x2 = 0, e qualquer valor para xı. Assim, os autovetores são da 


forma 
há E 
0 


Como os autovetores são todos desta forma, o espaço próprio do autovalor 3 é gerado pela base 


Exemplo 6.32. determinaremos os autovalores e autovetores de 
2 —1 1 
A=| Dm ls 
—1 00 


2-—À — 1 
det(A =X) = de: ( 0 3—À 1) 
—] 0 —A 
x? + 5x? =7x+3 
=—(x—-3(x— D(x— 1). 


O polinômio característoco de A é 


As raízes deste polinômio - e os autovalores de A - são portanto À = 1 e Az = 3. Encontramos os 
autovetores: 
* ParaÃhy = 1, 
Av= Av 
2.—1 1 a a 
0 31 bj=|b 
—1. 0 0 c c 


Disto obtemos o sistema 
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—a =C, 
e temos portanto os autovetores da forma 
a 
0 
—a 
* Parahy = 3, 
Av = Av 


Le aR =C): 


2a—b +c = 3a, 


Disto obtemos o sistema 


3b = 3b, 
—a = 3c, 
e temos portanto os autovetores da forma 
a 
—4a/3 |. < 
—a/3 


Exemplo 6.33. Oberemos agora os autovalores e autovetores, em Z2, da matriz 
110 
A=|1 01 
011 


data can) (1 A. 1) =-waenaon 
0 1 1-A 


O polinômio característico é 


com raízes 0 e 1. Agora resolvemos, para À, = 0, 


ou seja, 
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Chegamos a a = b = c, e os autovetores de Ay são da formd'] 


Para à2 = 1, temos 


ou seja, 
abBb=a 
abpce=b 
bec=c 


e obtemos b = 0, e a = c, e os autovetores de As são da forma? 


E) i 


Teorema 6.34. Se duas matrizes quadradas de ordem n com elementos de um mesmo corpo são similares, então elas 
tem o mesmo polinômio característico. 


Demonstração. Se A e B são similares, então existe P tal que B = P7! AP. Então 
det(xZ — B) = det(xZ — P7! AP) 
= det(x[PT!Z]P — P7! AP) (x) 
= det(PIxzP — PT AP) 
= det(P7! (xT — AJP) 
= det(P” ) det(xZ — A) det(P) 
= det(P)”! det(xZ — A) det(P) 
z3 Na A). 
(PT 


Na passagem (x), observe que PT'Z = P-! logo (PT'Z)P = P7'P =Z. E 
A recíproca deste Teorema não é verdadeira (veja o Exercício[169). 
Teorema 6.35. Os valores na diagonal de uma matriz triangular são seus autovalores. 


Demonstração. Basta resolvermos det(AZ — A) = 0 para uma matriz triangular A. 


A— 071 º º º (J 
A — a22 º ... 1] 
det : 
e 
A— Ann 


1Como Z é finito, o autoespaço de A só contém dois vetores, porque só há dois desta forma: (0,0,0)T e (1,1,1). Um deles 
equivale a a = 0 e outro equivale a a = 1. 
2Novamente, porque Z é finito, só há dois autovetores para A2: (0,0,0)! e (1,0,1)!. Um para a = 0 e um para a = 1. 
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=(A— a11 )(À — 022): (A — ann) =0, 


e portanto det(AZ — A) será zero se e somente se À for igual a um dos aii - ou seja, os elementos da diagonal 
são os autovalores da matriz. E 


Teorema 6.36 (de Cayley-Hamilton). Seja A uma matriz e p seu polinômio característico. Então p(A) = 0. 


a= 


Exemplo 6.37. Seja 


O polinômio característico de A é 


Calculamos então 


NO « 
(o 0) 
O Teorema de Gershgorin nos dá um intervalo para os autovalores de uma matriz, sem a necessidade 


de calculá-los. 


Teorema 6.38 (de Gershgorin, para autovalores reais). Seja A uma matriz quadrada de ordem n com entradas 
e autovalores reais. Seja 
n=} lajl. 


Então todos os autovalores de A pertencem ao intervalo 


U [au — Ti, ii + ri] f 


Demonstração. Seja v um autovetor de A com autovalor À - ou seja, Av = Av. Se abrirmos a expressão Av, 


temos 
Ds Qij Vj = AVi, vi. 
j 


Ao retirarmos a;; do somatório, obtemos 


3. CijV; E Avi — iiVi, vi 
jf 
= (À — aujvi. 


Seja i o índice do elemento de maior valor absoluto em v, ou seja, para todo j, [vi] > [vj]. Então 


(A — aujvi = 2 CijV 
jAi 
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A— qu = a dij 5 (dividimos por vi £ 0) 
1 


<> lol (porque [vil > lv;l) 


Ou seja, a distância entre AÀ e aii é < ri. Isto vale para quaisquer pares de autovetores e autovalores, e 
concluímos a demonstração. E 


1 30 0 
AM 2-1 4]: 
-5 295 


rı = |a12| + la13] = 30 


Exemplo 6.39. Seja 


Para esta matriz, temos 


r2 = |a2ı| + la23| = 6 


r3 = |a31| +laz32| =7 


Os intervalos são 


a 430 = [29,31] 
a22 + 6 = [7,5] 
a33 7 = [18,32] 


A união dos intervalos é [—29, 32]. Os autovalores de A são 


Mm = 17 — 2V13 x 9.788 
A2 = 17 + 2v13 x 24.211 
A = —9, 


toodos dentro do intervalo. < 


Exemplo 6.40. Notamos que nada impede que os intervalos sejam desconexos. Seja 
1 —1 0 
ÉS 20 1 je 
0 O —40 


r=|-1|=1 


Obtemos 
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r=|+1=1 
r3=0 


Assim, os autovalores devem estar nos intervalos 
Q11 ET] = [1,2] 
022 DT2 = [19,21] 
a33 E T3 = [ 40, 40] =f 40} 


A união destes conjuntos é desconexa (não é um único intervalo), como ilustra a próxima figura. 
e Ls = 


—40 =] 2 19 21 


Os autovalores de A são 1, 20 e —40 (note que A é triangular, portanto podemos inspecionar seus autova- 
lores em sua diagonal, sem a necessidade de cálculos). « 


Esta forma do Teorema de Gershgorin, no entanto, não vale para matrizes com autovalores complexos, 
porque usamos módulo para mensurar os valores |A — ai;|. Além disso, a relação < não é definida para 
complexos[] Por exemplo, para a matriz 

—1 1 
—2 1 


rı = |ai2}= 1 


teríamos 


t2 = jazi] = 2, 


obtendo os intervalos [—2, 0] e [-1, 3], mas os autovalores são +i e —i. Não podemos dizer que i < x ou 
i>u. 


6.1.1  Autovalores complexos 


Como os autovalores de uma matriz de elementos reais são raízes de um polinômio com coeficientes reais, 
pode ser que uma matriz de ordem n tenha menos de n autovalores reais. No entanto, toda matriz de 
ordemn sempre terán autovalores complexos (porque todo polinômio de grau n tem n raízes complexag'), 
contando as multiplicidades. Além disso, se o polinômio tem grau ímpar, ele tem ao menos uma raiz real. 


Teorema 6.41. Um operador T em um epsaço de dimensão n, com n ímpar, sempre terá um autovalor real. 


Demonstração. Pelo Lemagf6.22| o polinômio característico deste operador será 


14. + ao 


grau menor que n 


x" + anx" 
N. 


Quando x — co, o polinômio tende a +00. Quando x — —oo, o polinômio tende a —oo. Assim, pelo 
Teorema do Valor Intermediário, o polinômio tem pelo menos uma raiz real. E 


*Podemos usar a norma do número complexo, mas isto nos daria discos, e não intervalos. 
“Como todo polinômio de grau n com coeficientes complexos tem raízes em C, dizemos que C é um corpo algebricamente fechado. 
Claramente, R não é algebricamente fechado, já que x? + 1, com coeficientes em R, não tem raízes em R, mas sim em C. 
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E 


tem como polinômio característico x? + 4. Se a matriz A representar uma transformação linear de R? em 
RŽ, então a transformação não tem autovalores ou autovetores. Se A representar uma transformação de 
C2 em C?, então a transformação tem os autovalores —2i e +2i. < 


Exemplo 6.42. A matriz 


6.1.2 Matrizes complexas Hermitianas 


Definição 6.43. A matriz adjunta de uma matriz A, denotada'| AR, é a transposta da matriz que tem os 
conjugados complexos dos elementos de A. Ou seja, 
aH = Gi. + 


ij 


Exemplo 6.44. A seguir mostramos tres matrizes e suas adjuntas. 


q My Ei i o 0 
a=(-1 N ACRE co (1 2i ) 
2 33i 


1—2i 2+1 —i 1 2 
rP A = ( q :) B ) « 
SN ' O 1 0 0 -3i 
Definição 6.45 (Matriz Hermitiana). Uma matriz A é Hermitiana ou auto-adjunta se A = A", + 


As entradas na diagonal de uma matriz Hermitiana devem necessariamente ser reais, porque devem 
ser iguais a seus conjugados. 


Exemplo 6.46. A matriz 


é Hermitiana, porque 


eA = AM, < 


Exemplo 6.47. A matriz 


5Também é comum denotar a adjunta por A* ou At. 
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não é Hermitiana, porque não é igual a BH: 
E 
Di ias 12-10 1 2+i 0 
B =(B) =|2+i 1—i 3| =[2=; 1=1 3): 
0 37 0 37 
Be B! diferem na posição (2,2). < 


Toda matriz real é também complexa, já que R C C. Desta forma, toda matriz real simétrica é também 
Hermitiana. 


Exemplo 6.48. A matriz 


é Hermitiana, porque A! = A! = A, < 
Teorema 6.49. Se A é Hermitiana, seus autovalores são reais. 
Demonstração. Sejam A, A e v £ O, tais que A = Av. 
Av = Àv 
(Av)! = (Av)" 


viam = Ay" 


vA = vit (AH = A) 
vHAv = Av'ly 
v(Av) = Avv (A = Av) 
Avtv = Avtv 
A =À, 
mas isto significa que À € R. E 


Exemplo 6.50. Calculamos os autovalores da matriz 


A=( a 
2%-i —3 


O polinômio característico de A é x? + 2x — 8, cujas raízes são = —4 e 2, « 
Corolário 6.51. Toda matriz Hermitiana, mesmo que com entradas complexas, tem determinante real. 


Corolário 6.52. Toda matriz real simétrica tem autovalores reais. 
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6.2 Diagonalização de operadores 


Quando uma transformação linear é representada por uma matriz diagonal, sua aplicação sobre um vetor 
v consiste simplesmente na multiplicação de cada elemento da diagonal por um elemento de v (e não em 
uma multiplicação completa de matriz por vetor). Assim, ao invés de trabalharmos com uma transforma- 
ção arbitrária, cuja aplicação é o mesmo que a multiplicação de matriz por vetor, trabalhamos com uma 
transformação da forma 


dı 0 0 X1 
Digam Mr) = o d2 . 9 xa 
0 0 dn xr 


= dixi4 dox2 +--+ daXn. 


Em muitas situações é útil mudar de base para realizar operações onde a transformação é diagonal, e pos- 
teriormente voltar à base anterior. 

Mesmo que a matriz de uma transformação linear não seja diagonal, pode ser que a mesma transfor- 
mação possa ser representada por uma matriz diagonal em alguma base diferente. Nesta seção verificamos 
quando um operador pode ser representado de forma diagonal, e como obter esta forma. 


Definição 6.53 (Matriz diagonalizável). Uma matriz quadrada A é diagonalizável se é similar a uma matriz 
diagonal - ou seja, se existe P tal que PT! AP é diagonal. + 


5-4 4 
A=|-3 9 7]. 
-g e 4 


A matriz A é diagonalizável, porque é similar a uma matriz diagonal D. Temos D = P7! AP, onde 
200 l 203 a f0 1 4 
DEMO), P=|~1 2 25h54 =|1 1-2): 
003 0 —1/2 1/2 1 1 0 


Ç 0 —1 —4 5 -4 4 1 2 3 200 
P- AP=|1 1 -2]4-3 9 =7]{-—1 2 —2ļ]=ļ|05 0l. 
1 1 043 6 —4 © 1/2172 003 


A matriz D é a representação de A como matriz diagonal, em base diferente. 
Mais ainda, 2, 5 e 3 são os autovalores de A, < 


Exemplo 6.54. Seja 


Observe que 


Teorema 6.55. Uma matriz quadrada de ordem n é diagonalizável se e somente se tem n autovetores linearmente 
independentes. 


Demonstração. (=>) Se A é diagonalizável, existe P tal que D = P7! AP é diagonal: 
Aje O se O 
DARSAP=| 0 > 0 


Ò 0 o An 
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Então AP = PD. Sejam p!,...p" as colunas de P. Mas 
AP= (ap Ap? ... ap") 


PD = (xp! Mp? Map?) 


. Concluímos que: 
i) AP = PD implica que Apt = Apt, e 
ii) como P tem inversa, suas colunas são não-nulas e LI. 


Ou seja, as colunas de P são autovetores de A, e são LI. 
(=) Sejam p!,..., p” autovetores LI de A. Construa 


p=(p p? Eur p"), 


Então, para cada coluna pt, Ap! é a multiplicação de A por um de seus autovetores, que sabemos ser igual 
a àip*. Assim, AP = PD, onde D é a matriz diagonal com os autovalores A1, . . . An. Como as colunas de P 
são LI, P tem inversa, e podemos multiplicar “AP = PD” à esquerda por P-!,obtendoD = P'AP. E 


Método 6.56 (Diagonalização de matriz). Encontre n autovetores LI de A (denote-os v1, v2,...,Vn). Seja 
P a matriz tendo as colunas iguais a estes vetores - ou seja, P = (vı v2 ... vn). A matriz B = P-IAPé 
diagonal e similar a A. e 


Exemplo 6.57. Seja 


na 


Primeiro obtemos dois de seus autovetores LI, que são 


ha) e) 


Construímos então a matriz P e sua inversa: 


S AEG A) 


P'AP = G 2); « 
00 


Podemos escolher qualquer conjunto de autovetores LI para diagonalizar uma matriz. Cada conjunto 
diferente nos dará uma base diferente onde o operador pode ser escrito como matriz diagonal. observe que 
o que poderá mudar é a base, e consequentemente as matrizes de mudança de base - mas a matriz diagonal 
que representa o operador é sempre a mesma, contendo em sua diagonal os autovalores do operador. 


Temos então 
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1 —1 1 
fel 1 Ts 
0 0 —1 
A matriz À tem autovalores 0, —1 e 2. Os autovetores pertencentes a O são da forma (x, x, 0 


centes a —1 são da forma (y, y, —y)"; os pertencentes a 2 são da forma (z, —z,0)!. 
Escolhemos então autovetores para as colunas da matriz de mudança de base: (1,1,0)! (1,1, 1)! 


(1,—1,0)". Portanto, 
7 
1 1 1 | 12 1/2 1 
=|] 151 kan E: Ta 0 0 —1); 
1/2 1/2 0 


= O 00 
PO AP=to0 —1 0l, 
0 02 


Agora escolhemos autovetores diferentes para as colunas da matriz de mudança de base: (—2, —2,0)! 
(3,3,-3)! (—1,1,0)!. Temos desta vez 


2º Ya] —V4 —1/4 —1/2 
q= (5 3 1). tes 0 0 —1/3 


Exemplo 6.58. Seja 


)T; os perten- 


0 —3 0 —1/2 1/2 0 
E finalmente, 
E O 00 
OQ AQ=|041 0]. < 
O 02 


Exemplo 6.59. A matriz 


ahea 


tem polinômio característico (2— x)2, e com duas raízes iguais: o autovalor 2 tem multiplicidade algébrica 
igual a dois. Este autovalor tem somente autovetores da forma 


(a) 


e não podemos obter, portanto, dois autovetores linearmente independentes para construir uma matriz de 
mudança de base. A matriz não é diagonalizável. 
Na verdade, qualquer matriz da forma 


k 1.0 -0 

Ok 1 0 

0 0 k Jo 

; el 

00... 0 k 
com a constante k na diagonal e uns acima da diagonal terá n autovalores iguais a k, e o autoespaço de 
todos terá dimensão um. Nenhuma destas matrizes é diagonalizável. « 


Teorema 6.60. Autovetores pertencentes a diferentes autovalores são linearmente independentes. 
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6.3 Transformações lineares e matrizes não quadradas 


Até o momento tratamos de operadores lineares e suas representações como matrizes quadradas. Nesta 
seção mostramos um fato a respeito do espectro do produto de matrizes retangulares. 


Teorema 6.61. Sejam A e B duas transformações lineares, 


A:R™ >R" 
BR" SR”. 


As duas transformações são representadas por matrizes A, n x me Bm x n. Assim, estão bem definidos os produtos 
* AB, matriz quadrada de ordem n, e 
* BA, matriz quadrada de ordem m. 
Os autovalores não nulos de AB e BA são os mesmos. 
Demonstração. Seja v Æ 0 autovetor de AB pertencente a um autovalor não nulo, ou seja, 
ABv = Av, com à £0. 
Então 


(BJABv = BAv 
(BA)Bv = A(Bv), 


e temos Bv Æ 0, porque ABv = Av Æ 0. Assim, Bv é autovetor de BA pertencente ao mesmo autovalor 
À. E 


uE. 
I D T ag 5) 
ro 2 a 


3 —3 —3 

AB=([> 14 BA=|-8 6 8 
2 2y” 

2 0 -2 


Os autovalores de AB são 9, —2. Os de BA são 0, —2,9. « 


Exemplo 6.62. Sejam 


Temos 


6.4 Diagonalização simultânea de dois operadores 


Diagonalizar um operador é o mesmo que encontrar uma base na qual este operador é representado como 
uma matriz diagonal. Podemos eventualmente precisar representar dois (ou mais) operadores na forma 
diagonal, na mesma base. 
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Definição 6.63 (Operadores simultaneamente diagonalizáveis). Um conjunto de operadores (A;) é simul- 
taneamente diagonalizável se existe uma única matriz de mudança de base P tal que para todo operador 
A; do conjunto, P-!A;P é diagonal. 

Em particular, dois operadores A e B são simultaneamente diagonalizáveis se existe P não singular tal que 
tanto P“!AP como P7! BP são diagonais. + 


Lema 6.64. Sejam A e B dois operadores lineares em um mesmo espaço vetorial (de dimensão finita ou infinita). Se 
AB = BA, então o operador B é um operador linear no autoespaço de A (ou seja, se v está no autoespaço de A, Bv 
também está). 


Demonstração. Se v é autovetor de À para o operador A, então 
Av = Av 
BAv = BAv 
A(Bv) = A(Bv), 
portanto Bv também é autovetor de À. E 


Teorema 6.65. Dois operadores A e B em R” (e em qualquer espaço vetorial de dimensão finita) são diagonalizáveis 
simultaneamente se e somente se AB = BA. 


Demonstração. (=>) Se A e B são simultaneamente diagonalizáveis, então podemos escrever 


A =P 'ApP 
B = P—'BpP 
O produto AB é, portanto, 
AB = P—'ApPP 'BpP 
= P—'ApBpP 
= P7'BpApP (produto de diagonais é comutativo (Exercício[87)) 


=P'Bo(PP-!ApP 
= (P'BoP)(P!'ApP) 
=BA. 


(<=) Sejam Ay, Àz,..., A os autovalores de A. Seja dy, dz, . . ., dn uma base B formada por autovetores de 
A, ordenada por autovalor - ou seja, os primeiros vetores pertencem ao primeiro autovalor Ay, em seguida 
temos os vetores do autovalor Az, e assim por diante. Pelo Lemal6.64] a matriz que representa B nesta base 
é diagonal por blocos (leva autovetores de um autoespaço de A neste mesmo autoespaço): 


Bl=|0 Ba: O 
O 0. Bk 


Cada bloco i é uma matriz quadrada cuja ordem é a multiplicidade geométrica do autovalor A; de A. 
Temos portanto uma base em que B é descrito por uma matriz diagonal por blocos. Para obter uma matriz 
diagonal, observamos que podemos diagonalizar cada bloco separadamente. Para isso, basta tomar cada 
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bloco A; e obter m vetores LI (m é a multiplicidade geométrica de A;, todos no autoespaço de A; em A, 
que também sejam autovetores de B. Estes vetores serão autovetores tando de B como de A (e em A, eles 
pertencerão a Ài). E 


Exemplo 6.66. Começamos com um exemplo onde as duas matrizes já tem os mesmos autoespaços, por- 
tanto não precisamos diagonalizar blocos. Sejam 


A) ASI) 


AB =BA = S 3) 
h: 3 


os produtos AB e BA são iguais: 


Os autovalores e autovetores de A e B são 


A:— 1, (x, x)"; —3, (x, =x)" 
B: 0, (x, a)”; 2, (x, =x)! 


Assim, se usarmos os vetores 
para construir a matriz de mudança de base, teremos diagonalizado os dois operadores! Construímos 
Pay] 1) Pts (12 
| ==) 1/2 —1/2) 
Or- A DDE 
1/2 1/2) \ 0 =3/ U -1 12 
re (IDE) 
1/2 1/2) 10 25, 9091 1 1 


Os dois operadores são diagonais quando descritos na base ordenada 


e temos finalmente 


(0n =Y): « 


Exemplo 6.67. Sejam A e B dois operadores em R4: 


0030 0100 
A=|]00 03 >, B 1000 
3000 0001 
0300 0010 
Estes operadores comutam: 
0003 
AB=BA=|/0 030 
0300 
3000 
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Diagonalizamos À primeiro: seus autovalores são —3 e +3, cada um com multiplicidade algébrica 2. 
Os autoespaços são: 


1 0 1 0 
E-3)=|| 0), | dl), EsD=|[0], |] 
(—3) 4 0 (+3) i o 
0 —1 0 1 
Temos então uma base onde A é diagonal, 
1 010 
= 0 101 
id -1 01 0f’ 
0 —1 0 1 
e 
-3 000 
p-lap=| 0 300 
0 030 
0 003 
O operador B, descrito nsta base, é 
O 100 
pipp=|[1.0:0 0] — [e a 
0 0:01 0 B2 
0 0:10 


Os dois blocos são 


e cada bloco tem autovalores —1 e 1. Os autovetores de Bı (e de B2) são 


1), (1 

1 1 
O primeiro autovetor tem as coordenadas 1 e —1, indicando que posemos tomar os dois primeiros autove- 
tores d; e dz e usar d, — d; deve ser usado. 


De acordo com o segundo autovetor, dı + dz deve ser usado em seguida. 
O terceiro e quarto autovetores (de B2) nos dão d; + d4, portanto temos 


1 1 
Q=(di—d, di+do, >d d+d) =|] 11] 
1 1 


Temos 
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Nesta base, tanto A como B são diagonais: 


T Eor 0030 1 1 11 —3 000 
AL=01A0=-|1 1—1 -1 00 03|/-1 1-11|.] 0-300 
Ap Os a 3000]l-=1-1 11 O 030 

1 1 1 1 0300 = =1 1 0 003 

T a Ra 0100 1 1 11 -10 00 
B], =Q7'BQ=-|1 1-1) |i00M| Lil likes 01 00 
BSQ O do ja 00071 -i1 -1 11 0 0—1 0 

1 1 1 1] 0010 1 —1 11 00 01 


Notamos que, como os autovalores são os mesmos em qualquer base (matrizes similares tem os mesmos 
autovalores), podemos ver os autovalores de A e B nas suas representações diagonais na base y. « 


O Teoremagf6.65|pode ser generalizado para espaços de dimensão infinita. Não o faremos aqui. 


6.5 Cálculo de autovalores e autovetores 


Os métodos que apresentamos para determinar os autovalores e autovetores de uma transformação são 
úteis e eficientes para matrizes pequenas. Observe que se o polinômio característico de uma matriz tem 
grau elevado, não temos sequer fórmula para obter suas raízes. 


Teorema 6.68. Qualquer método para a obtenção do valor exato dos autovalores de matrizes de ordem n pode ser 
usado para obter as raízes de qualquer polinômio de grau n. 


A relevância deste Teorema se faz clara quando consideramos também o Teorema de Abel-Ruffini, que 
apresentamos sem demonstração. 


Teorema 6.69 (Abel-Ruffini). Não existe como descrever as raízes de polinômios de grau cinco ou mais alto, usando 
apenas as operações aritméticas básicas (soma, subtração, multiplicação, divisão e extração de raiz n-ésima). 


Isto não significa, no entanto: 


* queseja impossível encontrar autovalores para famílias específicas de matrizes (o exemplo mais sim- 
ples é o das matrizes triangulares, onde sequer precisamos de “método”, já que o sautovalores ficam 
expostos na diagonal); 


* que não haja método para aproximar autovalores. Na verdade há muitos deles; 


* que não haja método para a obtenção de autovalores exatos (o Teorema apenas diz que não podem 
ser obtidos usando apenas aquelas operações). 


Para grandes matrizes há diversos métodos de obtenção de autovalores, cujas descrições o leitor en- 
contrará na literatura de Cálculo Numérico [Fra07]. 


6.6 Aplicações 


Damos aqui uma pequena quantidade de aplicações dos conceitos apresentados neste Capítulo. No início 
da seção[6.2] dissemos que “em muitas situações é útil mudar de base para realizar operações onde a transformação 
é diagonal, e posteriormente voltar à base anterior”. Grande parte das aplicações nesta Seção resume-se a isto. 
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6.6.1 Potência de matriz [ diagonalização ] 

O cálculo da potência A” é muito simples quando A é diagonal: 
diag(a1,a2,..., ax)” = diag(aT, a5,..., ap). 

Se À não é diagonal, é necessário realizar uma grande quantidade de operações” 


n—1 operações 


mA, 
A" = AAA.. A 


Teorema 6.70. Seja A diaginalizável com A = PDP! ,en € N. Então 
A” =P. 
Demonstração. Para demonstrar, simplesmente reescrevemos A” como produto de n matrizes: 
n— 1 operações 
A” = AAA- -A 
= (PDP-!)(PDP-!)... (PDP7!) 
=PD(P'P)D(P! P)D... DP! 
= PDZDZT... DP”! 
PDP, E 


Se A é diagonalizável e n é muito grande, é vantajoso calcular a sua potência na base em que é diagonal, 
fazendo assim uma quantidade fixa (e pequena) de operações. 


Exemplo 6.71. Seja 


A matriz À é diagonalizável: 


-opoe 1 1) (MIT -3 
azai D(a) r): 


Calculamos AZ e A!º, 


Poderíamos também ter calculado 
£ 1/1 =t 2/3 
A2 — OD? E 1 n DE 3 = / 
CR -15 3/ 0 16/6115 4 30 6 
Para calcular A !º, podemos computar as nove multiplicações A.A - - - A, mas é mais simples calcular 


E Tfi =i sino = 
Alo = op! sl 1 1) i 0 ): 3 ( Fo | « 
apa —15 3/lo 410/6l5 1 2º 5115 2º 343 


éna verdade podemos calcular AŽ, depois AZA? = A?, depois A*A? = AS, depois ASAº = A32, etc, acelerando o processo, 
mas ainda assim a quantidade de operações pode ser arbitrariamente grande. 
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6.6.2 Relações de recorrência [ polinômio característico; diagonalização 


Definição 6.72 (Relação de recorrência). Uma relação de recorrência de ordem k é uma definição de uma 
sequência que descreve o n-ésimo termo como função dos k anteriores: 


q = Z1, 
Q2 = Z2; 
Ak = Zk 
an = f(an—1, An-2, ...4 An-k);, 


onde os valores iniciais z; são constantes. A definição da sequência deve incluir também k valores iniciais, 
além da equação recursiva. 
Uma recorrência é linear se é da forma 


An = C1 an1 +: + Crank + g(n), 
e é homogênea se g(n) = 0. + 


Exemplo 6.73. A função fatorial é dada pela recorrência 


que é linear e homogênea. « 
Exemplo 6.74. Como visto no Exemplo a sequência de Fibonacci pode ser definida pela recorrência 


F=], 
p=1, 
Fn = Fn- + Faca, 


e seus primeiros termos são 


F =1 (fs £5 
F2=1 Fe=8 y 
Fz =2 F =13 
Fa =3 Fs =21 


Estamos interessados no problema de, dada uma definição de sequência como recorrência, encontrar 
uma forma fechada para ela. 


Exemplo 6.75. Considere a sequência (an ) definida recursivamente a seguir. 


do = 1 


An = 20n+41 
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Os primeiros termos desta sequência são 


ao =1, 
al = 
az =4, 
as = 8, 


A forma fechada para o n-ésimo termo da sequência é 
An = 27 
que percebemos imediatamente apenas porque a sequência é familiar e muito simples. « 


Teorema 6.76. Uma equação recorrente de ordem k acompanhada de k valores iniciais define unicamente uma 
sequência. 

Se a equação estiver acompanhada de menos do que k valores iniciais, há mais de uma sequência que satisfaz a 
relação. 

Se a equação estiver acompanhada de menos do que k valores iniciais, uma de duas situações ocorrerá: ou a 
recorrência definirá uma única sequência, ou nenhuma sequência satisfará a definição. 


Definição 6.77 (Matriz associada a uma equação de recorrência linear). Uma equação de recorrência linear 
de ordem k 


An = C1Qn—1 + C2QAn-1 +: + CRANK 


pode ser descrita em forma matricial como 


c 
0 1 0 0 an An+1 
o 0 1 0 an+1 an2 
(0) 0 0 An+2 | = | Un43 
: 1 ; ; 
Ck Ck-1 Ck-2 ce CI Antk QAn+k+1 
A matriz C é chamada de matriz associada à equação de recorrência (an). + 


Exemplo 6.78. Para ilustrar a construção da matriz associada usamos a seguinte equação de recorência: 


1 
an = 2an=1 Ngh- + 20n-3 — Un-4. 


Os coeficientes da equação são (1, —3, 1/2, —1), e a matriz associada a esta equação é 
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de forma que 


an An+1 
An+1 — An+2 
C n — PE 5 
An+2 An+3 
An+3 An+4 
com an+4 = 2an+3 — 3an; + (1/2)an+1 — an, como esperado. < 
Vemos que C transforma an,..., an+k em outro vetor coluna, com an +1,... An+k+1. Se aplicarmos 


C novamente, obteremos os próximos k valores, e assim por diante. 


An An+1 An+2 

An+ An+ An+ 

n+1 c n+2 c n+3 c 
an+2 | —> | an3 —> | Qn+4 > 
An+k An+k+1 An+k+2 


Assim, se pudermos calcular C” e aplicar no vetor com os valores iniciais, teremos um valor com o valor 
de an na primeira posição. 
a1 An+1 
a2 An+2 
a3 | — | Qn43 


ak An+k 
Calcular C” é fácil se pudermos diagonalizá-la: determinamos a base em que C é diagonal, e calculamos 
PD%P™!, 
Assim, temos o seguinte método. 


Método 6.79. Seja C uma matriz associada a uma relação de recorrência de ordem k. Se D é diagonalizáve, 
sejam P e P7! as matrizes de mudança de base tais que D = P-! CP é diagonal. Seja Z o vetor coluna com 
os valores iniciais da recorrência, 
Z1 
z2 
Z=|23 


Zk 
A forma fechada para o n-ésimo termo da recorrência é dada pela primeira entrada do vetor 
PDM P-IZ, º 
Antes de exemplificarmos este método, apresentamos alguns Teoremas que tornam sua aplicação mais 
fácil. 


Teorema 6.80. Seja C a matriz associada à equação de recorrência de uma sequência an. O polinômio característico 
de Cé 
NEL + ek 1AT HH H 2A H ca. 


C não tem autovalores zero, e para qualquer autovalor À de C, an = A” é solução da recorrência an = Can-1. 
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Teorema 6.81. Seja À o autovalor de uma matriz associada a uma relação de recorrência linear de ordem k. Então 
(1, A, A2,..., AKTIT 
é autovetor pertencente a À. 


Exemplo 6.82. Considere a equação recorrente 


do = 1, 
q =2, 
an = —2an—1 +3an-2. 


A matriz associada a ela é 


A matriz de mudança de base e sua inversa são 


1 
P= 1 1 p-1®_/1 — ; 
E ) au 1 


O n-ésimo termo da sequência será dado por 


g o = PD PIZ 
An+1 


Ea 


6.6.3 Solução de sistemas de equações de diferença [ diagonalização ] 


Uma equação de diferenças é como uma equação diferencial, mas discreta. Uma equação de diferença, da 
forma x(t) = «x(t — 1) representa a evolução de um processo em tempo discreto, e é muito usada em bi- 
ologia, economia, engenharia e diversas outras áeras. Por exemplo, x(t) poderia representar a quantidade 
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de animais de uma certa espécie em um ecossistema, a quantidade de dinheiro em um fundo de investi- 
mento ou empréstimo, ou qualquer outra quantidade que evolua ao longo do tempo, e que dependa da 
quantidade em um momento anterior. 

Considere o sistema de equações de diferença 


x(t)=2x(t—1) 
x2(t) = (1/5)xz(t — 1) 
Como as duas equações são independentes, podem ser resolvidas separadamente. 

A primeira equação significa que a quantidade xı sempre dobra a cada unidade de tempo. Após t uni- 
dades de tempo, teremos portanto xy (0) multiplicado por 2+. 

De acordo com a segunda equação, x2 cai para um quinto a cada unidade de tempo. No tempo t, por- 
tanto, teremos x, (0) multiplicado por 5" +. 

Já podemos agora calcular x; (t) e x2(t) a partir de seus valores iniciais: 


xı (t) = 2*xı (0) 
x2(t}= 5"*xa(0) 


Este sistema foi resolvido facilmente porque as equações são independentes - ou seja, se o representarmos 
como uma matriz, na forma x(t) = Ax(t — 1), então A será diagonal: 


-f2 o0 
a(i a 


Sabemos que 2 e 5 são os autovalores desta matriz, e que seus autovetores são da forma (ax1,0)" e (0, bx,)!. 
Cada uma das duas equações é a expressão de Ax = Ax para um dos autovalores e um dos autovetores: 

Quando as equações não são independentes, a matriz dos coeficientes do sistema não é diagonal. To- 
mamos agora como exemplo o sistema a seguir. 


xı (t) = 2xı (t — 1) + 2x2(t— 1) 
x2(t) =2xı (t — 1) + 5x2 (t — 1) 


Não conseguimos resolver as equações isoladamente, como fizemos antes, porque elas dependem uma da 
outra. Se o descrevermos na forma matricial, a matriz dos coeficientes será 


A=(2 2). 
2 5 
Notamos, no entanto, que A é diagonalizável: seus autovalores são 6 e 1, com autovetores da forma (a, 2a)! 
e (b,-b/2)!. 


A matriz A descreve o sistema na base canônica C. Obtemos agora a matriz diagonal similar a A, ou 
seja, a matriz diagonal D = [A]s, que descreve o sistema em uma base ô, e as matrizes de mudança de base: 


mg ID = (69 
4/5 CAOS) À2 5/12 —1/2 01 
Isso significa que as matrizes P e P—!, de mudança de base, nos permitem levar vetores para a base 6 onde 


A é diagonal. Como usaremos a matriz na base 6, precisamos também descrever o vetor x nesta base. Seja 


y = kls. 
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Determinamos agora como escrever x em função de y e y em função de x. Para isso, aplicamos as matrizes 
de mudança de base em ambos. Começamos por y = Px: 


£ E a fa) = fa o) 
4/5 —2/5 X2 (4x1 — 2x2)/5 


y1 = (xı +2x2)/5 
y2 = (4x1 — 2x2)/5 


= a (nt 
2 —1/2 2y1 — y2/2 


Xx1 = Y1 +Uz 
x2 = 2y1 — y2/2 


Assim, 


Agora calculamos Py: 


Ou seja, 


Agora resolvemos o sistema 


(t) = 6yi(t=1) 


yı 
y2(t) = y2(t— 1). 


Este segundo sistema consiste de duas equações independentes, e verificamos facilmente que 


1(t) = 6*y1 (0) 


y 
y2(t) = y2 (0). 


Finalmente, conseguimos escrever xı (t) ex2 (t) em função de xı (0) e x2 (0): 


xı (t) = yı (t) +y2(t) 
= 6*y1 (0) + y2 (0) 


=t (= (0) 0) l (= (0) — 
5 T 


x2 (t) = 2y1 (t) — y2(t)/2 
= 2(6'y1 (0)) — (1/2)y2(0) 


2 |6t x1(0) oe | 1 (= (0) o) 
5 2 5 


6.6.4 Exponencial de matriz [ diagonalização ] 


Da mesma forma que a exponencial e* surge na solução de equações diferenciais, a exponencial e^, onde 
A é uma matriz, também tem papel importante na solução de sistemas de equações diferenciais. 
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A exponencial e* para números x reais e complexos é definida comd/] 
o i 
x 
e* = ) e, 
il 
i=0 
A exponencial de uma matriz é definida exatamente da mesma forma, porque a definição só depende 


de podermos calcular a n-ésima potência da matriz. 
Definição 6.83 (Exponencial de matriz). Seja A uma matriz quadrada. A exponencial de A é definida como 


+ 


Primeiro observamos que é fácil calcular eP para qualquer matriz diagonal D. 


Teorema 6.84. Seja D uma matriz diagonal. Então 


D SR d d d 
e = diag(es 1 €223--05 eri: 
Demonstração. 
So . 
D: 
e? = am 
i=0 | 
i 
= di 
= > 1 d22 
Mi 
i=0 
dnn 
dis 
i! . 
2 do> 
-F| A 
i=0 à 
dan 
i! 
oo di 
2. ico i! 
pa d5> 
= i=0 à! 
Ee din 
i=0 il 
edi 
ad ed22 
ednn 
“Esta é a expansão de Taylor no zero (a série de Maclaurin), 
„  exp(0)(x?) exp'(0)x!  exp'(0)x? | exp”(o)x? 
e = + + 
0! 1! 2! 3! 
ja * x2 0x3 
= ra at 
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Exemplo 6.85. Seja 


. 200 
D = diag(2,4,1) = |0 4 ; 
001 
Então 


Agora tratamos de matrizes não diagonais, mas diagonalzáveis. 
Teorema 6.86. Se A é diagonalizável, com A = PDP”, então e^ = PeDp-1, 


Demonstração. Usaremos o teoremag6.70| que nos garante que A” = PD"p-1, 
Calculamos agora 


e^ = 2 a = ` A =P pa >) P~! = PeP P~! E 


i=0 


Exemplo 6.87. Seja 


Calculamos e? a seguir. A matriz tem autovalores 4 e 2, e é diagonalizável: D = P—! AP é diagonal, com 


pæ My 1 p=(40) p-f 1 
2U —1)? O2)’ 1 —1 


Assim, 


Como A = PDP7!, temos 


am et +e? e!-e2 l P 
21e! e? ef +e? 


Exemplo 6.88. Mencionamos que podemos precisar trabalhar com autovalores complexos, mesmo que 
nossa matriz seja real. Este exemplo ilustra tal situação. 


Seja 
A-( 01), 
—1 0 


Calculamos e? a seguir. A matriz tem autovalores —i e i, e é diagonalizável: D = P7! AP é diagonal, com 


a e 0) 
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Assim, 


Finalmente, A = PDP”, portanto 


eA=pePpl=[( 1 1)(eto)(12 2 1 ettet o å 
+ iJ \0 e/11/2 —/2 Z2hiel-iel ette 
Teorema 6.89. Se A é uma matriz quadrada diagonalizável com autovalores ^1, Az, . . ., An, então os autovalores 


de e^ são e, eM2,..., ed, 


Demonstração. Sabemos que se A é diagonalizável, A = PDP”!, onde D é diagonal, e os elementos dii são 
os autovalores de A. Também sabemos que 


Mi.. A. 


eP — diag(e se 
Pe P-! são matrizes de mudança de base e não modificam os autovalores, e como 
e^ = PeP P7!, 


os autovalores de e^ são os mesmos que os de A. E 


Exemplo 6.90. Seja 


1 2 


com autovalores e! = e e e^, 


Seja 


(3.4) 


Seus autovalores são 1 e —3. A exponencial de B é 


com autovalores e e e73, «4 


6.6.5 Solução de sistemas de equações diferenciais [ diagonalização | 


Na seção descrevemos um método para resolver sistemas de equações de diferença. Nesta seção tra- 
tamos de sistemas de equações diferenciais. Uma resumida introdução às Equações Diferenciais é dada no 
Apêndice[ô] 
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Definição 6.91 (Sistema de equações diferenciais). Um sistema de equações diferenciais é um conjunto de 
equações diferenciais. + 


Dado um sistema de equações diferenciais, que contém equações envolvendo derivadas de várias fun- 
ções diferentes, possivelmente compartilhando argumentos, queremos determinar a forma fechada para 
estas funções em função de valores iniciais para elas. 

Precisaremos neste exemplo do conceito de derivada de um vetor, que definimos a seguir. Também 
definimos, por completude, integração de vetores. 


Definição 6.92 (Derivação e integração de vetor). Seja y um vetor de funções, ou seja, 


vyi(x) 
y2(x) 


yn (x) 


Denotamos por y; a i-ésima função. A derivada de y, que denotamos y’, é 


Consequentemente, temos que definir a integral de y em um dado intervalo como 


JÈ y1dx 
b 
| ydx = f y2 dx 
a 
fe Yn dx 
Integrais indefinidas são obtidas e forma semelhante. + 
Exemplo 6.93. Seja 
x? + y 
v= | sen(x) |, 
xy 


onde y é uma constante (o vetor v contém funções de uma variável x). Temos 


d 4 (x? is y) 2x 
—vVv= + sen(x) = | cos(x) 
dx b 

dxXY y 


Também podemos integrar o vetor: 


EC 
[vax = | fsen(x)dx | = — cos(x) : 
Jxydx EM 
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Considere o sistema de equações diferenciais lineares a seguir. 


1 
Yı = any T 012Y2 Te T AinYn 
Yj = ay + A2242 +` + A2nYn 
; 
Yn S 011Y1 + 022Y2 T t: T AnnYn 


Este sistema pode ser descrito em forma matricial, tendo as funções y; como incógnitas: 


, 
Ay =), 
onde 

1 
Q11 Q12 t Ain yı Yı 
1 
_ | 021 Q22 a21 —_ | Y2 ro | Y2 
A=] < ' B= h” yA 
an1 An2 cc: Ann Yn Yh 


Lema 6.94. Seja x € R e A uma matriz quadrada. Então 


Demonstração. 


a “a US A 
xA? Ca A? 
=A+ RD 
= T xA xA? 
Ra AS as S 
Ae*^ 
E 
Teorema 6.95. A solução geral para o sistema 
d 
J =AylY 
com n variáveis e n é 
y(t) = e*^y(0) 
Demonstração. Suponha que 
y(t) = e*^y(0). 
Derivamos ambos os lados da equação, obtendo 
d 
Ht) = — tA 
vt) = Fey) 
= Ae*^y(0) 
= Ay(t), (porque presumimos que y(t) = et^y(0)) 


o que conclui a demonstração. E 
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Para determinar a solução para um sistema de equações diferenciais lineares, calculamos et^ da forma 


descrita na seção 


Exemplo 6.96. Considere o sistema dinâmico 
108) = 2y1 (t) + 3y2(t) 
y(t) = 2y1 (t) +y2(t). 


A matriz de coeficientes é 


Os autovalores de A são 4 e —1, com autovetores (1,2/3)! e (1,—1)", respectivamente. Já podemos dia- 


gonalizar A: 
a=- 1 N AlB 37 
2/3-—1)/ \0 —1/512 -3 


tA 


A solução para &y(t)Ay(t) é y(t) = e*“y(0), que calculamos agora: 


e*^y(0) = P-letD Py(0) 


4 1 1 4t 0 3/5. 3/5 

E LJ J) k d ES ns 
qua +2) 
et(2et — 2) 


e 
e 
a a + 2)y1 (0) + (385 — a) a 
Qet — 2)y1 (0) + (Det +3)y2(0) 


O livro de Luiz Henrique Alves Monteiro [Mon02] é uma excelente introdução aos sistemas dinâmicos. 


6.6.6 Cadeias de Markov | autovalor; autovetor | 


Há uma descrição simplificada de Cadeias de Markov no apêndice [o] Esta seção dá um tratamento mais 
rigoroso ao assunto. 

Um processo estocástico é uma maneira de descrever a evolução de diversas variáveis aleatórias ao longo 
do tempo. Pode-se, por exemplo, descrever a evolução do DNA de uma população; do estado futuro de 
máquinas em uma indústria; do crescimento de populações, e diversos outros sistemas. 

Usaremos como exemplo a modelagem, extremamente simplificada, da evolução de uma doença. Su- 
ponha que 

Representamos o estado de um sistema em um processo estocástico como um vetor de estado. A evo- 
lução do sistema é descrita por uma sequencia de vetores de estado, onde cada um pode depender, proba- 
bilisticamente, dos anteriores. 


Definição 6.97 (cadeia de Markov). Se um sistema pode ser descrito em um dado momento t por um vetor 
de estados, e o estado no momento t + 1 depende apenas do estado no momento t e de probabilidades de 
transição entre estados, então a sequência de vetores de estado desse sistema é uma cadeia de Markov. 4 
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Definição 6.98 (matriz de transição). Se, para cada par de estados i,j, a probabilidade de transição de i 
para j é pij, então a matriz de transição da cadeia de Markov é dada por (pi), ou 


pm P12 Pis 
P= | P21 P22 P23 + 
P31 P32 P33 


0.2 0.1 0.7 
P= (0.1 0.5 0.4 
0.6 0.2 0.2 
representa as probabilidades de transição em uma cadeia de Markov com tres estados. < 


Exemplo 6.99. A matriz 


Um vetor estocástico é um vetor que representa uma distribuição de probabilidades. 


Definição 6.100 (vetor estocástico). Um vetor v € R” é estocástico se 3 , vi = 1, e todos os vi são não- 
negativos. + 


Exemplo 6.101. Os vetores (1,0, 0)", (1/2, 1/2,0)" e (1/4,0,3/4,0)! são estocásticos. < 


Definição 6.102 (matriz estocástica). Uma matriz é estocástica se todas as suas linhas ou todas as suas 
colunas forem vetores estocásticos. 

Se tanto as linhas como as colunas de uma matriz são vetors estocásticos, dizemos que a matriz é du- 
plamente estocástica. + 


Exemplo 6.103. A matriz de transição de qualquer cadeia de Markov é estocástica. Por exemplo, a matriz 
do exemploļ6.99]é uma matriz estocástica, porque só tem entradas positivas e asoma de cada linhaéum. « 


As matrizes de transição são operadores lineares, e o teoremaļ6.104|nos mostra como podemos usá-las. 


Teorema 6.104. Sejam A e B duas matrizes estocásticas, e p um vetor estocástico tais que os produtos AB e Ap 
são bem definidos. Então AB também é uma matriz estocástica e Ap é um vetor estocástico. 


O teorema |6.105|nos dá a interpretação da multiplicação de uma matriz de transição por um vetor 
estocástico. 


Teorema 6.105. Seja T a matriz de transição de uma cadeia de Markov, e p um vetor estocástico representando uma 
distribuição de probabilidades sobre os estados da cadeia. A matriz T, quando usada como operador linear em p, leva 
à distribuição de probabilidades depois de um estágio. 


Demonstração. Seuponha que T seja estocástica nas colunas. A coluna j, portanto contém as probabilidades 
de, estando no estado j, haver transição para cada um dos outros estados - ou seja, aij é a probabilidade 
de haver transição para i quando o estado anterior era j. Então 


tii tr ce tm Pa 
Tp= tar t22 t2n p2 

tni tn2 tnn Pn 

tipi + t21Pp2 +: + tnipPn 


ti2p1 + t22P2 +: + tn2Pn 


tapa T tn2P2 T ERE tnnPn 
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pilta +t21 +e + ta) 
p2(t12 + t22 +- + tn2) 


Pnltin +t2n +: + tnn) 
Se a matriz é estocástica nas linhas, pode-se repetir o argumento com o operador à direita, pT = p’. E 


Fica claro então que podemos aplciar a matriz de transição T iteradamente para obter a distribuição de 
probabilidade sobre os estados após k estágios: 


(T(T---T(Tp)---)) =(TT™. T)p = T*p. 
“o 


k aplicações 
Teorema 6.106. Toda matriz estocástica tem um autovalor igual a um, e todos os outros autovalores são menores 
ou iguais a um. 


O vetor estocástico cuja existência o teoremal6.106|garante é chamado de distribuição estacionária. 
De maneira geral, uma cadeia de Markov pode ter mais de uma distribuição estacionária 


Exemplo 6.107. Se uma cadeia de Markov tem a matriz de transição 


(3 9. 


verificamos facilmente que há dois autovalores iguais a um, e que seus autovetores são 
(1,0)" e- (0,1)". 


Assim, as duas distribuições estacionárias são 


Exemplo 6.108. Na matriz de transição 


O ü= 
O 


O 
Hs O O 


uA A—= 


o autovalor 1 tem multiplicidade algébrica dois, com os autovetores 
(1,1,0,0)" de? (0,0,1,1)". 


Assim, as duas distribuições estacionárias são 


11 5 AN 
(5:20) e (0,055) . «4 


Cadeias de Markov são descritas na literatura de probabilidade e processos estocásticos - por exem- 


plo, o livro de Robert Ash [Ashos] dá uma breve introdução; os livros de Erhan Çinlar [Çin13] e de Pierre 
Bremaud [Bre08] tratam extensivamente do assunto. 
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6.6.7 Classificação de relevância (pagerank) [ autovalor; autovetor |] 


Nos primeiros anos da Internet, havia uma grande quantidade de páginas disponíveis ao público, e muitos 
mecanismos de busca que indexavam estas páginas. Usuários podiam buscar palavras-chave e obter uma 
lista de páginas relacionadas com tais palavras. 

Um problema importante para aqueles mecanismos de busca era o de decidir em que ordem apresentar 
a lista - idealmente, as páginas mais relevantes seriam apresentadas primeiro, mas não era fácil definir a 
relevância de cada página. 

O primeiro método a oferecer resultado satisfatório a este problema foi o algoritmo pagerank, cujo fun- 
damento descrevemos a seguir. 

Conceitualmente, a Internet pode ser vista como um grafo dirigido - ou seja, um grafo onde as arestas tem 
direção. Neste tipo de grafo, não definimos arestas como conjuntos de dois nós, e sim como par ordenado: 
a aresta (a, b) é diferente da aresta (b, a). 

No grafo que representa a rede cada página é um nó, e uma aresta indo do nó a ao nó b significa que a 
página a tem um link para a página b. 

Uma página relevante deve receber muitos links, portanto sua pontuação deve, de alguma forma, de- 
pender da quantidade de arestas que chegam a ela no grafo. O grafo a seguir é um exemplo, em pequena 
escala. 


No entanto, não queremos que uma página tenha grande influência sobre a relevância das outras so- 
mente porque tem uma grande lista de links. Resolvemos isso determinando que, se uma página i tem k 
links para outras, cada um deles contribuirá com n; = 1/k para as páginas para onde estiverem apontando. 
Para o grafo mostrado na figura, temos 


nı = 1/2, 
m=l, 
n3 = 1/3, 
ng =1, 
ns = 1/2. 


A classificação de cada página i será dada então por um valor xi, que é composto pela soma das influências 
das outras páginas: a; é a influência da página 1 sobre i; a; é a influência da página 2 sobre i, e assim 
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por diante. Para determinar a classificação das páginas, precisamos resolver o sistema a seguir. 


Q11X1 + 2X2 + ce + adnXn= Xx 
Q21X2 + Q22X2 + + QA2nXn = X2 
an1Xı F QAn2X2 + + danXn= Xn; 


onde aij pode ser zero ou nj. Usando a representação do sistema como matriz, podemos perceber que o 
que procuramos é um vetor x que satisfaça Ax = x - ou seja, um autovetor que pertença ao autovalor 1. 
Sabemos determinar autovalores e autovetores, portanto só nos resta definir o que fazer se a matriz não 
tiver o atovalor 1. Esta questão se resolve observando que cada coluna da matriz tem somatório igual a um. 
(0) teoremaļ6.106]nos garante que sempre encontraremos o autovetor que contém a classificação (a de- 
monstração é pedida no exercício[192). 
A matriz de coeficientes do sistema para nosso exemplo é 


O 1 0 0 1⁄2 
1/2 O 1⁄3 0 0 
A=| 0 0 O O 1⁄2 
O 0 1⁄3 0 0 
1/2 0 1/3 1 0 


O autovalor 1 de A tem o autovetor (8, 5,3,1,6)!. Este éo vetor de relevâncias. 


x =l, 

x2 = 5/8 = 0.625, 

x3 = 3/8 = 0.375, 

x4 = 1/8 = 0.127, 

x5 = 6/8 = 0.75. 
O nó mais relevante é o de número um; o segundo mais relevante, o de número cinco. Observe que ao con- 
trário do que acontece com cadeias de Markov, não é necessário que o vetor de relevância seja estocástico: 
queremos apenas uma ordem de relevância entre os nós. 

O algoritmo PageRank foi desenvolvido por Sergey Brin e Lawrence Page, fundadores da empresa Go- 


ogle [Pag+99]. Há diversas modificações e ajustes feitas posteriormente para que o método funcione bem 
na prática. 


6.6.8 Cálculo de polinômio de matriz [ polinômio característico; teo- 
rema de Cayley-Hamilton ] 


Suponha que precisemos calcular o valor de um polinômio t cujo argumento é uma matriz, 
t(A), 


e com grau menor que o do polinômio característico de A. 
Seja p o polinômio característico de A. Podemos usar o algoritmo de Euclides para dividir t por p, 
obtendo q e r tais que 
HA) = p(A)q(A) + r(A). 
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Como p(A) = 0, temos 


mas o grau de r é necessariamente menor que o de t. Repetindo este procedimento, obteremos o resultado 
mais rapiamente do que se tentássemos o cálculo direto. 


Exemplo 6.109. Seja 
t(x) = xf — 6 + 15x) — 13x3 + x. 


(1) 
4 3 
Para calcularmos t(A), determinamos seu polinômio característico, 
p(x) = det(A — xT) = x? — 4x +7. 
Agora dividimos t por p, e obtemos 
t(x) = p(x) (xf — 2x?) +x? +x, 


e portanto 
t(A) = A? +A: 


Podemos dividir mais uma vez, e obtemos 
t(A) = p(A)(A +4) + 10A — 287. 
Assim, 


t(A) = 10A — 287 
e e Ba 0) | 3 
40 2 
6.6.9 Inversão de matrizes [ polinômio característico; teorema de Cayley- 
Hamilton ] 


O teorema de Cayley-Hamilton nos permite, em algumas situações, encontrar a inversa de uma matriz de 
maneira rápida, se pudermos facilmente isolar AT! 


a-f1 2 
VE O 


p(x) =x) +x +4. 


Exemplo 6.110. Seja 


com poliômio característico 


Pelo Teorema de Cayley-Hamilton, temos 


A? +A+4I=0 
A? +A =—4T 
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Calculamos 


E de fato, verificamos que 


6.6.10 Grafos | autovalores ] 


A partir da descrição matricial de um grafo é possível extrair uma grande quantidade de informações a res- 
peito dele. O polinômio característico, autovalores e autovetores do grafo, particularmente importantes, 
são objeto de estudo da Teoria Espectral de Grafos [Mier1|cDs80]. Nesta Seção apresentamos a matriz Lapla- 
ciana, fundamental na Teoria espectral de Grafos, e mostramos uma de suas aplicações mais elementares. 


Definição 6.111 (Matriz de adjacência de grafo). Seja G = (V, E) um grafo. A matriz de ajdacência de G é a 
matriz A tal que aij = 1 se e somente se existe aresta entre os vértices i ej. + 


Exemplo 6.112. Considere o grafo a seguir. 


vı 
v2 
V5 V3 
V4 
A matriz de ajdacencia deste grafo é 
00110 
00101 
11001 
10000 
01100 
Como o grafo não é dirigido, a matriz é simétrica, já que (i,j) e (j, i) representam a mesma aresta. < 


Definição 6.113 (Matriz Laplaciana de grafo). Seja G = (V, E) um grafo. A matriz Laplaciana de G é 
les D=A, 


onde D é a matriz diagonal com di; igual ao grau do vértice i e A é a matriz de adjacência de G. + 
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Exemplo 6.114. A seguir temos um exemplo de grafo. 


2 
3 
1 
4 
5 
A matriz de adjacência deste grafo é 
00101 
00010 
AD 0001 
01000 
10100 


A diagonal com os graus é 


D = diag(2,1,2,1,2) = 


0000h4 
OO oO moO 
SONO o 
0+000 
NOoOoooo 


A matriz Laplaciana é, portanto, 


2 0—1 0-1 
0-1 0—1 0 
L=D-A=|—1 0 2 0-1 < 


=" 0 -1 002 
Teorema 6.115. Todos os autovalores de qualquer grafo são não-negativos. 
Teorema 6.116. A matriz Laplaciana de um grafo sempre tem zero como autovalor. 


Demonstração. Cada linha i contém o grau do vértice i, d(i), na diagonal, mas também tem —1 repetido 
d(i) vezes (uma para cada vizinho). Assim, a soma de cada linha é zero, e o Lemaļ4.27|nos garante que há 
linhas LD, e consequentemente det Lg = 0, nos garantindo que zero é autovalor. 


Definição 6.117 (Componente conexo). Seja G = (V,E) um grafo. Um componente conexo de G é um 
subgrafo de G onde, para quaisquer dois vértices diferentes v,w € V, existe um caminho de v até w 
formado por arestas neste subgrafo. + 


Exemplo 6.118. Considere o grafo a seguir. 
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Este grafo tem dois componentes conexos: um formado pelos vértices 1, 2, 3 e o outro pelos vértices 4,5, 6. 

< 
Definição 6.119 (Grafo conexo). Um grafo é conexo se tem somente um componente conexo. + 


Teorema 6.120. Seja G um grafo. A quantidade de componentes conexos de G é igual à multiplicidade algébrica 
do autovalor zero de Lg. 


Demonstração. Os vértices podem ser reordenados de forma que a matriz de adjacência seja diagonal por 
blocos, onde cada bloco é a matriz de adjacência de um componente conexo. 


Ai 


Ak 


Cada Ax é a matriz de adjacência de um componente. A construção da Laplaciana não altera a estrutuda 
dos blocos. 


Li 
[e R 
Lk 
Cada um dos blocos da matriz Laplaciana é, ele mesmo, uma matriz Laplaciana L; = D; — A; de um grafo 
conexo, e portanto cada bloco tem o autovalor zero com multiplicidade um. E 


Corolário 6.121. Se G é um grafo conexo, a multiplicidade algébrica do autovalor zero em Lg éum. 


Exemplo 6.122. O grafo a seguir tem um vértice isolado e dois outros ligados por uma aresta. Tem, por- 
tanto, dois componentes conexos. 


“1 


A matriz Laplaciana deste grafo é 


e seus autovalores são 


O (multiplicidade 2) 
2. (multiplicidade 1). 


A multiplicidade do autovalor zero é dois, como esperávamos, já que o grafo tem dois componentes conexos. 
< 
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Exemplo 6.123. O grafo a seguir, chamado de K3, é completo (ou seja, há arestas ligando cada vértice a 
todos os outros) e portanto tem um único componente conexo: 


2 


A matriz Laplaciana deste grafo é 


e seus autovalores são 


O (multiplicidade 1) 
3 (multiplicidade 2). 


A multiplicidade do autovalor zero é um, já que o grafo tem um único componente conexo. « 


Exercícios 

Ex. 167 — Prove que o subespaço próprio da Definição[6.11]é de fato um subespaço de V. 
Ex. 168 — Encontre os autovetores da matriz do exemplo [6.42] 

Ex. 169 — Refute a recíproca do Teorema[6.34] 


Ex. 170 — Demonstre o Teoremal6.24| 


Ex. 171 — Identifique famílias de matrizes de ordem n cujos polinômios característicos tenham exata- 
mente: 


i)n + 1 termos 
ii) n termos 


iii) mn — 1 termos 
Ex. 172 — Quais as matrizes de ordem 2 que tem autovalores reais? 
Ex. 173 — Quando matrizes de rotação são diagonalizáveis com autovalores reais? 


Ex. 174 — Prove o Lemaf6.22| 


Ex. 175 — Quais são os autovalores de uma matriz quadrada anti-simétrica de ordem 2, com pelo menos 
uma entrada não-nula? 


264 CAPÍTULO 6. AUTOVALORES, AUTOVETORES E DIAGONALIZAÇÃO 


Ex. 176 — Calcule os autovalores e autovetores das matrizes. Para cada uma, diga se (ou quando) é diago- 


nalizável. 
Ei 1 0 x «18 111l 
E I E: K); (4 i (o Dh 


0 0 
a 1 0 a 1 0 a 0 0 
O a 1)» O a 1)» 1 a 0), 
00 a 0 0 b 0 1l b 
a b 0 010 12 1 
b a 0 102)» 22 0): 
0 0 a-b 110 1 0 —1 


Ex. 177 — Encontre uma matriz com autovalores —5 e 7, sendo que o autovalor —5 deve ter autovetores 
da forma (1, —3/2)", e o autovalor 7 deve ter autovetores da forma (1,3/2)". 


Ex. 178 — Diga para que ângulos O a matriz a seguir tem autovalores reais. Comente o significado geomé- 
trico da matriz e dos autovalores reais que calculou. 


(os 0 —sen o) 
sen O cos O 
Ex. 179 — Para cada matriz do exercício diagonalize ou mostre porque não é possível. 


Ex. 180 — Calcule os autovalores, os autovetores e diagonalize (se possível) os seguintes operadores line- 
ares. A primeira é em Z4, e o segundo é em Z5. 


Ex. 181 — Diga se os operadores são simultaneamente diagonalizáveis, e quando forem, mostre a base que 
os torna diagonais. 


i) 


Ex. 182 — Determine x ey para que A e B sejam simultaneamente diagonalizáveis. 


G i) eG a) 
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Ex. 183 — Calcule os autovalores, os autovetores e diagonalize (se possível) os seguintes operadores line- 
ares. A primeira é em CŽ, e o segundo é em QIv 22. 


(4) G aA 


Ex. 184 — Considere a sequência definida pela recorrência 


ao =1, 
q =2, 
a2 =5, 


an = an-ı — 20n-2 + 20h03 
Mostre a matriz associada a esta recorrência, o polinômio característico, e os autovetores. 
Ex. 185 — Para cada sistema de equações de diferença, escreva x(t) em função de x(0): 


x(t) = 3x1 (t—1)—x2(t=1) 
x2(t) = —x2(t — 1) + 3x2(t — 1) 


x(t) = -2x1 (t—1) + x2(t—1) 
x2 (t) = 3x2 (t — 1) — 2x2 (t — 1) 


Ex. 186 — Dê a solução geral para os sistemas de equações diferenciais a seguir. 


yi =2y1 — 2y2 
dy = —3y2 + y2 
yi =2y1 — 242 
yj =—3y1 + Y2 — Y3 
Y5 = -y1 = Y2 — Y3 


Ex. 187 — Prove o teoremal6.104 


Ex. 188 — Prove (usando exemplos pequenos) que uma matriz estocástica pode ter: 
i) Determinante zero 
ii) Autovalores zero 
iii) Determinante negativo 


iv) Autovalores complexos 
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Ex. 189 — Prove que uma matriz estocástica pode não ser diagonalizável. 


Ex. 190 — Prove que uma matriz estocástica de ordem 2 com entradas estritamente positivas sempre tem 
um autovalor menor que um (ou seja, a multiplicidade do autovalor um é exatamente um). 


Ex. 191 — Fixadon, o conjunto das matrizes complexas de ordem n formam um espaço vetorial sobre C? 
E sobre R? 


Ex. 192 — Prove o teorema|6.106 


Ex. 193 — Prove que se a matriz de transição de uma cadeia de Markov é simétrica, a distribuição uniforme 
é estacionária. 


Ex. 194 — Considere a cadeia de Markov com tres estados onde não acontecem transições de um estadoa 
outro: a probabilidade de se permanecer no mesmo estado é sempre 1. A matriz de transição desta cadeia 
é T3, que tem somente o autovalor 1, com multiplicidade 3. Os autovetores são 


(1,0,0)" 
(0,1,0)" 
(0,0,1)', 
que são três distribuições estacionárias. No entanto, como a matriz de transição é igual à identidade, 


qualquer outra distribuição também será estacionária. Explique porque só encontramos três distribuições 
quando calculamos os autovetores. 


Ex. 195 — A matriz usada no pagerank (na seção|6.6.7) é uma matriz “estocástica”. Isso significa que deve 
haver alguma interpretação probabilística para o vetor obtido pelo algoritmo. Descreva esta interpretação, 
e diga o que teria que ser feito com os vetores de relevância. 


Ex. 196 — Prove que se o maior grau de vértice um grafo G é k, então k é maior que o módulo do maior 
autovalor da matriz de adjacência de G. 


Ex. 197 — Prove que o conjunto de autovalores e uma base de autovetores determina completamente e 
unicamente um grafo. 


Ex. 198 — suponha que um grafo G seja regular (todos os vértices tem o mesmo grau). Prove que o vetor 
(1,1,...,1)! é autovetor de G, e diga a que autovalor ele pertence. 


Ex. 199 — Tente diagonalizar o operador do exemplo e explicite as dificuldades que encontrar. 


Ex. 200 — Escolha um operador linear no espaço de ciclos de um grafo com pelo menos 5 ciclos diferentes, 
e tente diagonalizá-lo. Que semelhança este exercício tem com o exercício 
Ex. 201 — Prove que 

i) Se Z é a matriz zero,e? = J. 

ii) de A =Z. 


iii) Se A e B são de mesma ordem e AB = BA, então eñe? = e 


6.6. APLICAÇÕES 267 


iv) Para toda matriz quadrada A, e^ tem inversa. 


v) Para toda matriz quadrada A, (eô)! = e7^, 


Ex. 202 — Mostre que para qualquer matriz A complexa, det eô = etrtA), 


Ex. 203 — Mostre que para qualquer matriz real A, Tr A = log(det(e?)). 
Ex. 204 — Mostre que os autovalores de A! são os conjugados dos autovalores de A. 


Ex. 205 — Seja G um grafo com n vértices. Mostre que a soma dos autovalores de Lg é menor ou igual a 
n. 


Ex. 206 — Denotamos por C, o grafo que consiste somente de um ciclo com n vértices. Por exemplo, Cs 
é mostrado a seguir. 


4 


Como é, de maneira geral, a matriz Laplaceana de Cn? O que se pode dizer sobre seus autovalores? 
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Capítulo 7 


Produto Interno 


Nos outros Capítulos trabalhamos com espaços vetoriais sobre corpos quaisquer. Neste Capítulo nos res- 
tringimos a espaços sobre o corpo dos números reais (há uma seção que discorre muito brevemente sobre 
a extensão dos conceitos abordados aqui para espaços complexos). 


7.1 Produto interno e norma 
Definição 7.1 (Produto interno). Um produto interno em um espaço vetorial V sobre R é uma função de 
V x V emR, que denotamos porfl(u, v), com as propriedades a seguir. 

e comutatividade (ou simetria): (u, v) = (v, u) 

* positividade: (v, v) > 0, e (0,0) = 0. 


* bilinearidade: o produto interno é linear em seu primeiro argumento (e como é comutativo, é tam- 
bém linear no segundo argumento) - para todo escalar k e vetores u, v, w, 


(u+w,v) = (u,v) + (w,v) 
(kv, w) = k (v, w) + 
Exemplo 7.2. Em Rĉ, é usual definir o produto de dois vetores como 
(x,y) =X1y1 + x242, 
que geometricamente é o produto das magnitudes de x e y, e do cosseno do ângulo entre eles. 


X 


y 


Também é comum denotar o produto interno por (u, v), ou por (ulv). 
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(x, y) = Ixll llyllcos O 
Assim, o produto de (1, —2)" com (—1,1)! é 
(0, DEDO = (1)(—1) + (—2)(1) = —3. 
Podemos verificar que (x,y) definido desta forma é realmente produto interno: 
e Claramente, (x,y) = (y, x). 


* (x,y) é positivo: 
(0,0) =0x0+0x0=0. 


(x,X) =x1X1 + X2X2 =x? +x >0. 


* É bilinear. Verificamos a multiplicação por escalar, 


(ax,y) = (axı, ax2)" (yr, y2)" 
= 0X1Y1 + ax2y2 
= a(xiy1 + x2y2 
=a (x,y), 


e a soma, 


(x+ 2,7) = (x1 + z1,x2 +22)! (yr, y2)" 
= (xı +2z1)yı + (x2 + z2)42 
= X141 + Z1Y1 + X2Y2 + z2y2 
= (x,y) + (2,9). « 


Este não é o único produto interno em R?. 
Exemplo 7.3. Em Rº, (x,y) = 2x141 + 3x2y2 também é produto interno. 
i) é comutativo 
ii) é positivo: 
(x, x) = 2x1Xx1 + 3x2x2 


Tx + 3x3 
>0. 


Além disso, (0,0) = 0. 
iii) é bilinear: 
(kv,w) = 2kviwy + 3kvzwz 


= k(2kviwy + 3kvzwz) 
=k(v,w). 
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(u +v, w) = 2(u7 + vi)wa + 3(u2 + v2)w2 
= 2uıw1 + 2viw + 3uzw2 + 3v2 W2 


= (2w +3u2w2) + (2vıw, +3vaw2) 


= (u,w) + (v, w). 


Exemplo 7.4. Em R”, uma função usual de produto interno é 


(u,v) = ulv= 3. UiVi. 
i 


Pode-se verificar facilmente que este produto é comutativo, bilinear e positivo. 


Exemplo 7.5. Em R2, (v, w) = (vi + wi) (vz + w2) não é produto interno. 


i) é comutativo: 


(v, w) = (vı + w1 )(v2 + w2) 
= (wi +v1ı)(w2 +72) 
= (w, v) 
ii) não é positivo: 
(v, v} = (vi + vi) (vz +72) 
= 4v] V2, 
que pode ser menor que zero. 
iii) não é bilinear: 
(kv, w) = (kvı + w1)(kv2 + w2), 


que de maneira geral não é igual a k (v, w). 


271 


< 


Exemplo 7.6. Obteremos neste exemplo um produto interno para espaço de funções. Embora possamos 
escolher qualquer produto interno que satisfaça a definição[7.1] construiremos uma definição de produto 
interno particularmente interessante para espaços de funções - uma definição análoga à de produto in- 
terno em R”. Escolhemos para o exemplo o espaço Cº 0, 1], embora seja claro que o desenvolvimento é 


também válido para outros espaços de funções. 


Sejam f e g funções em Cº 0, 1], o espaço das funções contínuas no intervalo [0, 1]. Podemos dividir o 
intervalo [0, 1] em n subintervalos iguais, como em uma soma de Riemann, e sabemos que quando n > oo 


n 1 


> fg > | f(x)g(x)dx, 


i=0 o 


com Ax = 1/n. 
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Podemos reescrever f(i) = a; e g(i) = bi, e teremos dois vetores com os valores das funções em 
(RES +25,.... 


f* : (a1, a23. -.3 an)! 


g* : (b1,b2,..., bn)! 


O produto interno destes dois vetores é > abi, que é semelhante à soma de Riemann que resulta na 
integral de f(x)g(x): 


n 1 
Ax aibi > | f(x) g(x) dx. 
i=1 9 


Por isso seria interessante definir o produto interno em C? [0, 1] como 


1 


(1,9) = | sho gtx)dx. 


“Te g(x) = 1, temos (f, g) = 


No entanto, esta integral pode ser divergente (por exemplo, se f(x) = x 
f ldx, que é divergente. 


Podemos usar este produto para o subespaço de C? [0, 1] composto pelas funções f tais que 


1 
| f(x)dx 
0 
não diverge. Este é de fato um subespaço, porque (i) a função constante zero é integrável em qualquer 
intervalo; (ii) a multiplicação por escalar não pode fazer uma integral divergir, e (iii) se tanto f como g são 
integráveis em algum intervalo, f + g também é. « 


Exemplo 7.7. As funções f(x) = 2x e g(x) = cos(x) são definidas no espaço de funções contínuas C[0, 71]. 
O produto interno destas funções neste espaço é 


(f,9) = [i 2x cos(x)dx 


TT 
= 2(xsenx + cosx) i 
=—4, 
Veja que se mudarmos o intervalo para, por exemplo, C[0, 7/2], teremos mudado o espaço vetorial em que 
trabalhamos, e o produto interno também muda: 
A 
(f, g9) = | 2x cos(x) dx 
0 


r/2 
= 2(xsenx + cosx)|. 


=n—2. < 


Exemplo 7.8. No espaço Mn xn, O produto de Frobenius, denotado A : B, é um produto interno: 


(A, B) =A:B =) > auyby. 
i j 
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Se 


então 
(A,B) = A : B = (1)(1) +(-2(1) + (3)(0) + (3-2) = —7. « 


Exemplo 7.9. No espaço Mnxn, 
(A, B) = maior autovalor de A'B 


é produto interno: 


i) comutatividade: os autovalores de A! e A são os mesmos, assim como os de B! e B. Desta forma, os 
autovalores de A!B e de BT A também são os mesmos 


ii) positividade: seja Z a matriz zero. Então Z!Z = Z, que só tem autovalores zero. Além disso, os 
autovalores de ATA são todos positivos. 


iii) bilinearidade: vemos claramente que como 
(A+C)'B=A!BYCTB, 
e os autovalores da soma de dois operadores são as somas dos autovalores, temos 
(A + C, B) = (A, B) + (C, B). 


Também observamos que 
(kA)!B =k(A!B). 


Como a multiplicação do operador por k também multiplica todos seus autovalores por k, temos 
(kA, B) = k (A,B). < 


Exemplo 7.10. No espaço Mnxn, a multiplicação de matrizes não é produto interno, porque (i) não é 
função de Mnyn x Mnxn em R; e (ii) porque a operação não é comutativa. « 


Exemplo 7.11. No espaço Mnxn, a função f(A,B) = det(AB) não é produto interno. Verificamos as 
propriedades: 


i) vale a comutatividade: det(AB) = det(A) det(B) = det(BA). 
ii) vale a positividade: det(AA) = det(A) det(A) = [det(A)]? > 0, e det(0 - 0) = 0. 
iii) a função não é bilinear: 
(kA, B) = det(kAB) 
= det(kA) det(B) 


= k” det(A) det(B) 
=k” (A,B). « 
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Exemplo 7.12. Damos agora um exemplo de dois produtos internos diferentes no mesmo espaço vetorial. 
No espaço Rn [x], de polinômios com grau menor ou igual an, sejam 


T An—1Xn—1 Ttt T A1X1 T do 


anx” 
n 
DnX” + bn—1Xn—1 ++ bixi + bo. 


Definimos os dois produtos 
n 
(p,q) =) aibi 
i=0 


1 
(p,q) = | Plato da 


Os dois são de fato produtos internos, porque são comutativos, positivos e bilineares, mas são completa- 
mente diferentes. 
Exemplificamos com dois polinômios em Rs [x]: 
p=x -x 
q=4x +2 


Então, 


(p, 9), = (0)(2) + (~1)(0) + (1)(4) =4 


1 
8 
(pa) = | poaa = -5 « 


Exemplo 7.13. Considere o conjunto de todas as sequências (an ) tais que 


oo 
Po la? 
i=1 


converge (observe que usamos |ai|2, e não simplesmente aZ, porque a; pode ser complexo). Chamamos 
este espaço de £2. Este conjunto é um subespaço do espaço de sequencias. Por exemplo, considere a se- 
quencia 

an =1/n. 


Podemos verificar facilmente que |(an )|? converge: 


oO 


2 
Die = E, 


i=1 


portanto (an) € £2. 
l2 tem dimensão infinita, porque as sequências tem comprimento (quantidade de termos) infinito. 
Apesar disso, podemos identificar uma base para este espaço: o conjunto (infinito) de sequências 


(1,0,0,...) 
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(0,1,0...) 
(0,0,1,...) 


ou seja, as sequências onde somente um termo é igual a um, e os outros são zero. 
A sequência an = x?, por exemplo, pode ser expressa como a combinação linear infinita 


1(1,0,0,0,...) 
+4(0,1,0,0,...) 
+9(0,0,1,0,...) 


Em (>, definimos 
(lan), (bn)) =D. aibi, 
i=1 


que é produto interno. 
Exemplificamos com duas sequências: 


(an) = = 
n! 
1 
(bn) = mm 
O produto interno das duas sequências é 
oo (0,0) 1 
(Can), (bn)) =) abi=) = =e]. < 
i=1 i=1 


Exemplo 7.14. No espaço de ciclos de um grafo (definido no exemplo páginaļ2o}, definimos o produto 
interno de dois grafos de ciclos disjuntos da seguinte maneira. Sejam c e d os vetores característicos dos 
dois grafos. Então 


OD) => c Ady 


onde a soma é em R, não em Z2. Claramente, f dá o número de arestas em comum dos dois grafos. 
Sejam G e H os grafos a seguir. 


V = {a, b,c, d, e, f, g} 
E(G) = {(a, b), (b, c), (c, a), (d, e), (e, f), (f, g), (g, d)) 
E(H) = {(a, b), (b, d), (d; g), (g, f), (f, c), (c, a)} 
b d b d 
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Os vetores característicos de arestas de G, H, e o valor de gi A hi são 


aresta 


H gi Ahi 


{a, b} 
{a,c} 
{a, d} 
{a, e} 
{a, f} 
{a, g} 
{b,c} 
{b, d} 
{b, e} 
{b, f} 
{b, g} 
{c,d} 
tc, e} 
tc, f} 
{c, g} 
{d, e} 
td, f} 
{d, g} 
{e, f} 
{e, g} 
{f, 9} 


O produto de G com H é, portanto, 


(GH) =} g^h =4 


G 
1 
1 
0 
0 
0 
0 
1 
0 
0 
0 
0 
0 
0 
0 
0 
1 
0 
1 
1 
0 
1 


=O O. O O 0 + O OO O 04 OQ O 00 + mcm 


1 


o om Jiooooooooo ooo ooo + 
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Teorema 7.15 (Desigualdade de Cauchy-Schwarz-Bunyakovsky). Seja V um espaço vetorial com produto in- 
terno,eu,v € V. Então 


Demonstração. 


Temos então 


(u,w)? < (u, u) (ww). 


. Seja k um escalar. Então 


(ku +w,ku +w) > 0 


(ku + w, ku + w) = (ku, ku + w) + (w, ku + w) 
= ( (ku, ku) + (ku, w) ) + ( (w, ku) + (w, w) ) 


= k? (u,u) + 2k (u, w) + (w, w). 


(u u) k? +2(u,w)k+(w,w) > 0 


7.1. PRODUTO INTERNO E NORMA 277 


O lado esquerdo da equação define um polinômio do segundo grau, com a = (u,u),b = 2 (u, w) ec = 
(w, w). Como a desigualdade determina que este polinômio tenha valor maior que zero, ele não pode 
ter soluções diferentes (a parábola pode tocar o eixo das abscissas, mas não pode ter pontos abaixo dele). 
Assim, seu discriminante, b? — 4ac, não pode ser positivo: 


Q(u,w))—4((u,u) (w,w)) < 0 
(u,w)? — (u,u) (w,w) < 0 
(u, w)? < (uu) (ww). E 


Proposição 7.16. A desigualdade de Cauchy-Schwarz-Bunyakovsky se reduz a uma igualdade se os vetores são LI. 
Definição 7.17 (Norma). A norma de um veto?)v, denotada por ||vl||, é iguala 4/(v, v}. 4 


Exemplo 7.18. Em R”, se usarmos o produto usual, (x, y}, a norma será 


Ixl| =x" 


a 2 2 2 
o MEX + «4 


Exemplo 7.19. No espaço Cº[0, 1] de funções contínuas com o produto definido no exemplo[7.6] a norma 
de uma função é 


1 
lifl] = | (Hx) dx. « 


Exemplo 7.20. Se o produto for dado por (A, B) = > ; > , ai;bi; como no exemplo[7.8] temos a norma de 


Frobenius, 
JAl==9> > a}. « 
i j 


Exemplo 7.21. No espaço de matrizes quadradas com entradas complexas, se usarmos o produto interno 
(A, B) = maior autovalor de A"B, 


teremos a norma 


IIAll> = maior autovalor de AHA. 


Para matrizes reais podemos usar AT ao invés de AH, « 


Exemplo 7.22. Sejam 


a=(1 0% po=f-1 
2º" 31 
Os autovalores das matrizes são: 
A:—1,1 
B:—2,2 


2Na verdade esta é apenas uma norma. Pode-se definir várias outras, como por exemplo xlhp = */ Xi IxilP, para p > 0. 
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Para calcular a norma de Frobenius, temos 
All = 4/12 +22 + (—1)2 = v6. 


IBI = (71) +12 +32 +1? = V72 = 2v3. 


As normas são, portanto, 


All = 1 IAll= 6 
IIBllp = 2 IBIl=2v3 « 


Exemplo 7.23. Usando o produto interno do exemplo facilmente verificamos que a norma nos dá a 
quantidade de arestas no grafo de ciclos. « 


Exemplo 7.24. Em f2, usaremos o produto interno 
00 
(kdn), (bn) = > aibi. 
i=1 


Calculamos a norma da sequência (bn ) do exemplo 


2n 
A norma de (bn) é 
0 0 1 
Eu-jDe-5 + 
1 
i= i=] v3 
Definição 7.25 (Distância entre vetores). A distância entre dois vetores v e w, é d(v,w) = Ilv — wll. 4, 


Fica evidente que d(v, v) = 0. 
Exemplo 7.26. Usando o produto usual em R”, a distância é dada por 
d(x,y) = y x =y)" (e —y). « 


Exemplo 7.27. No espaço C? [0, 1] de funções contínuas com o produto definido no exemplo[7.6] a distância 
entre duas funções é 


d(f, g) = (f—=g,f— g9) 


Mais concretamente, se f(x) = x e g(x) = e*, então 


1 
a(f,9) = y | (f(x) — g(x)2 dx 
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3e2 — 13 
6 
= 1.236066900616086... < 


Exemplo 7.28. Com o produto (A,B) = A : B = } ; }_; aijbij do exemplo 7.8] a distância entre duas 
matrizes é 


d(A,B)=(A-B):(A-B) 


= (> Dai = bis)2. 
i j 


Para um exemplo concreto, tomemos 


104 3 0 
A=4.3 10], B=| 20 
Ml 5 5d 
Primeiro calculamos 


DD (a-b) = (UNa (4-3) + (2822 + (1—0) + (0—1) + (2+5)? 
i j 


=44+1+25+1+1+49=3]. 


A distância entre À e B é, portanto, 


JE o= vB ES < 
i j 


2X0 0 DY o o0 
A=lo 41), B=[ 2 3 1 
1—1 3 Zi =) -3 


Exemplo 7.29. Sejam 


Calculamos A — B: 


Como produto (A,B) =A :B =} ,)aibi;do exemplo[7.8) calculamos a distância entre A e B, que é 
a norma de C: 


d(A,B) = ||A — B|| = v (A — B, A — B) 


=/1+0+0+(-2)2+1+0+22+1+0 
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=vV1+4+1+4+1 
=v11. 


Agora calculamos a distância novamente, mas usando outro produto interno: temos 


" 900 
C C=|020 
000 


os autovalores de C = A — B são portanto 0,2 e 9. A distância é 


d(A,B) = ||A — Bll = v (A — B, A — B) 


= „/max{0, 2,9} 
= V9 =3. « 


Exemplo 7.30. No espaço de ciclos de um grafo, a distância entre dois grafos é a raiz quadrada da quanti- 
dade de arestas não comuns dos grafos. 


Usamos os mesmos grafos G e H do exemplo cuja descrição apresentamos novamente a seguir. 
V=(a,b,c,d,e,f,g) 


E(G) = {(a, b), (b, c), (c,a), (d, e), (e, f), (f, g), (g, d)) 
E(H) = tha, b), (b, d), (d, g), (g, f), (f, c), (c, a)} 


b d b d 
< > <> 
c f c f 
G H 


A distância entre G e H é 


d(G,H) = IIG — HI| 
=/(6-H,6-H) 


O grafo G — H é formado subtraindo os vetores característico das arestas - ou seja, uma aresta está em 
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G — H se está em um grafo mas não no outro. Os vetores característicos de arestas de G, H e G — H são 


(9) 
| 
E 


aresta 
{a, b} 
{a,c} 
{a, d} 
{a, e} 
{a, f} 
{a, g} 
{b,c} 
{b, d} 
tb, e) 
tb, f} 
{b, g} 
tc, d} 
{c,e} 
{c, f} 
{c, g} 
{d, e} 
td, f} 
td, g} 
{e, f} 
{e, g} 
{f, g} 


ao Å= = Om OOO GQGIEO F Hamn ~ OOGO Onm algm 
-00-7 000-=0000o0~ 00O O oO aalT 
(e e E a A a + o oooo ma —oooooo 


Como em Z2, tanto a soma como a subtração são o ou exclusivo, 


VIEREM = 3 torci tom 
=v5. < 


Definição 7.31 (matriz de Gram). Seja {v1, V2, ..., Vn} um conjunto de vetores. A matriz de Gram deste 
conjunto é a matriz G de ordem n tal que 


gij = (Vi, Vj), 


ou seja, 
(vi, vi) (V1, V2) = (V1, Vn) 
G= [vid Way o Won) |. A 
(WV) (nova) ce (Vas Vn) 


Se os vetores pertencem a R” são dispostos como colunas de uma matriz V, então a matriz de Gram é 
VTV. se pertencem a C”, a matriz de Gram é VHV. 
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Exemplo 7.32. Em R3, usando o produto interno usual, a matriz de Gram dos vetores 


n=(8 l) i 


(vi, vi) oa (v1, v3) ( Sa 20) 


(ON 


G = | (v2,v1) (v2,v2) (V2,v3) — 10 20 
(v3, v1) (v3,v2) (v3,V3) 12 20 96 
Exemplo 7.33. Em F, no intervalo [—7, +r] e usando o produto interno usual (JZ 
de Gram de 


x f(x)g(x)dx), a matriz 


fı(x) =sen(x), f2(x) = cos(x), ,f3(x) =x 
é 
(vivi) (viva) (vi, v3) dS sen? (x)dx se sen(x) cos(x) dx JE x sen(x)dx 
G= | (v2,v1) v2, v2) v2, v3) | = Fà sen(x) cos(x)dx am cos? (x)dx JEn xcos(x)dx 
(V3,V1) (V3,V2) (V3,V3) JE x sen(x)dx JE x cos(x)dx JE x dx 


wy O 2m 
On 0l. 
2n 0 27/3 


Exemplo 7.34. A seguir temos três matrizes 2 x 2. 


ske a (io) 


Se usarmos o produto de Frobenius, a matriz de Gram destas matrizes é 
A:A A:B A:C 4 —4 —2 
G=|B:A B:B B:C|)-=|-4 8 2 
C:A C:B C:C —2 —2 6 
< 


Teorema 7.35. Um conjunto de vetores é LI se e somente se sua matriz de Gram tem determinante diferente de zero. 


7.2  Ângulos e ortogonalidade 


O produto interno de dois vetores pode ser arbitrariamente grande. Podemos obter valores em um inter- 
valo limitado se dividirmos o produto interno pelo produto das normas dos vetores. Com isso temos o 
cosseno do ângulo destes vetores, que sempre estará entre —1 e 1. 


Definição 7.36 (Ângulo entre dois vetores). O ângulo entre dois vetores v e w é o número O tal que 


O ww) 
EINT 


Ə = arccos ( mw ) . + 


livi] lwil 


ou 


7.2. ÂNGULOS E ORTOGONALIDADE 283 


Exemplo 7.37. Em R?, o ângulo entre os vetores (0, 1)" e (1,0) é 


F (0,01, (0,17) 
a (sm TOUN 


=arccos ((1,0)", (0,1)") 


=arccos(0) = 5. 


Já entre os vetores (3,5) e (—1,0) o ângulo é 


0 =arccos (o (=1,0)") ) 


(3,5)"IHI(—1,0) "|l 


= arccos 8, = 2.11121582706548... < 


WE 


Exemplo 7.38. O ângulo entre os vetores v = (2,4,1,-5)!ew = (1,0, —3, —3) T 


O = arccos (nt) 
[vil Iwl] 


arccos ( (2,4,1, —5)(1, 0, =3, 3)" ) 
E 1(2,4,1, —5)" || II(1,0, —3, —3)" || 


14 
= drccos | ——— 
(Em ) 
= 1.07747129721464... « 


Exemplo 7.39. No espaço Cº[0, 1] das funções contínuas definidas no intervalo [0, 1], o ângulo entre as 


funções f(x) = x? — x e g(x) =X? — xé 


= (f, 9) 
é ds (ii 2A 


= arccos god 
n T g(x)2dx 


A 2 
= arccos [x fol C dk ) 


(x3 fx) Pax fo (x 2 -x2dx 


= arccos ( 1/20 -) 
2/15v7 


= arccos (2) 


= 0.12532783116806... < 


Teorema 7.40 (Teorema de Pitágoras generalizado). Em um espaço vetorialcom produto interno, para quaisquer 
dois vetores v e w com ângulo 6, 


Iv + wll? = [ivil + Ihwll? + 2llvl] Ilwll cos 8. 
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2 


Exemplo 7.41. No exemplo[7.39]calculamos o ângulo entre as funções f(x) = x? — xe g(x) = x4 — x no 
espaço Cº[0, 1], cujo cosseno é 3YZ, A norma de (f + 9)(x) = x? + x? — 2x é, portanto, 
IE + gl? = Ifl? + igl? + 2If|l llgll cos 8 
3v7 
= |k? — xl? + lx? — xl? + 2]hxê — xII IIx? — xl 8 
1 7 1 7 1 1 
7 
= | (x3 —x)2dx | + | (x2-x)2dx | +2 | (x) — x)2dx | (x2 — x)2dx 3v7 
0 0 0 0 8 
Calculamos as integrais, e obtemos 
1 
| (e — x)2 dx = 8/105 
0 
1 
| (x? — x)? dx = 1/30 
0 
Continuamos: 
2 2 
8 1 8 1 \ /3v7 
f + gl? = | ql Ss +2 
IE + gl 5) + 5) (5) (5) ( 3 ) 
23 6 /8 1 
= 210 8V105 3077 
23 6 VB 
210 8.,/(30)(105) 
-23 6 va 
-210 8225 
8,62 
-210 815 
o 2 
-105 
Sem o Teorema de Pitágoras, calculamos o mesmo valor: 
IE + gll? = lx? + xº — 2x] 
2 
1 
= Gl (x2 + x3 — aero 
0 
2 
ro 
7) 105 
22 
< 
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Há uma noção de ortogonalidade em R? e Rº, que aqui estendemos para todos os espaços vetoriais com 
produto interno. 


Definição 7.42 (Vetores ortogonais). Dois vetores v e w em um espaço com produto interno são ortogonais 
se (v,w) = 0. + 


Claramente, o ângulo entre vetores ortogonais é 7/2, porque é arccos[0/(I|x|| Ily] =arccos(0) = 7/2. 


Exemplo 7.43. Em R? com o produto usual, os vetores (2,3,4)! e (1, 2,1)" são ortogonais. « 


Exemplo 7.44. Em R” com o produto usual, quaisquer dois vetores da base canônica são ortogonais. « 


Exemplo 7.45. Em C[—7, 1], o espaço de funções contínuas definidas entre —r e n, o produto interno 
pode ser dado por 


(f, g) = [ M)g(x)dx. « 


Neste espaço, os vetores (funções) cos(x) e sen(x) são ortogonais, porque 
TE 
| cos(x) sen(x)dx = 0. 
AL 


Exemplo 7.46. Em M2x2 as matrizes 


3) RSA) 


são ortogonais se usarmos o produto de Frobenius, porque A : B = 0. < 


Exemplo 7.47. Usando o produto interno definido no exemploļ7.14| está claro que dois grafos de ciclos são 
ortogonais quando não há arestas comuns entre os dois grafos. « 


Teorema 7.48. Em um espaço com produto interno, sen vetores V1, . . ., Vn diferentes de O são ortogonais entre si, 
então também são LI. 


Demonstração. Suponha que v1, . . . , Vn diferentes de O são ortogonais e LD. Então existem a; tais que 
avi +: + ann =0 
com ay Æ 0. Tomamos o produto da equação por v1: 


(v1, avi +: +anvivn) = V10 
(vi, avı) = 0 
aı (v1, v1) =0, 
e como presumimos que ay Æ 0, concluímos que vı = 0. E 
Corolário 7.49. Em um espaço de dimensão n, quaisquer n vetores ortogonais formam uma base. 
Corolário 7.50. Em um espaço de dimensão n, há no máximo n vetores ortogonais entre si. 


Exemplo 7.51. Em R?, quaisquer dois vetores ortogonais são LI, e não há como obter mais de dois vetores 
ortogonais em R?, 
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w : (—2,1) v: (1,2) 


Na figura acima, v = (1,2)! ew = (—2,1)". Os dois vetores são ortogonais, e claramente LI (não são 
colineares). Além disso, não se pode obter um terceiro vetor no plano que não seja combinação linear 
destes. < 


Exemplo 7.52. Os vetores dos exemplos e que ali mostramos serem ortogonais, são claramente 
LI. 

Os vetores do exemplo também são LI: não há como descrever seno como múltiplo de cosseno. 

As matrizes do exemplo[7.46/são LI: podemos verificar que aA + bB = 0 implica em a = b = 0: 


280 (1 Da 
a(i À E E 3) 


implica em 
2a + b= 
3a— 2b = 
—a—4b=0? 
—2b= 
cuja única solução é a = b = 0. « 


Exemplo 7.53. Damos um contraexemplo para a recíproca do teorema[7.48] Os vetores (1,2)! e (1,3)! 
em R? são LI, mas não são ortogonais, porque (1,2) (1,3) =1+6=7. « 


Observe que de acordo com o teorema|7.48|é necessário que haja algum produto interno para os quais 
os vetores sejam ortogonais, como mostra o próximo exemplo. 


Exemplo 7.54. Considere o espaço Rz [x] com o produto interno (p, q) = 5 p(x)q(x)dx. Os polinômios 
p(x) = x? — 2/6, q(x) = x e r(x) = 1 são ortogonais: 


1 4 
i p(x)q(x)dx = | (e — =) xdx = O 


—1 {1 


Pelo teorema os tres polinômios são também LI, e portanto uma base para R2[x]. 
Suponha que 


p(x) = a2x? + ax + do 


q(x) = box? +bi;x+bo 
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r(x) = cox? +cix+co 


Neste mesmo espaço, com o produto interno (p(x), q(x)) = a2b2 + ayby + aobo, temos 


2 
(plc), r(x) = (1,0, —2/6)" (0,0,1)" = —% #0, 
e os vetores não são ortogonais. Ainda assim, são LI. 4 


pEi f(x)g(x)dx. As funções 


Exemplo 7.55. Considere o espaço C[—7r, 7], com o produto interno (f, g) = f2 


f(x) = x e g(x) = sen? (x) são ortogonais neste espaço, e portanto LI: 


+ 
| xsen?(x)dx = 0 


= 


Estas funções são base para um subespaço de C[-=7, +71]. Neste subespaço estão as funções ax + b sen? (x). 
Se incluirmos h(x) = x-+cos? (x) —1 teremos o conjunto { x, sen? (x), x + cos? (x) — 1 }. Este conjunto 
não é LI, porque 
sen? (x) + (x + cos? (x) — 1) =x. 


De acordo com o teorema as funções não podem ser todas ortogonais. E realmente, sen? (x) e x + 
cos? (x) — 1 não são ortogonais com o produto interno dado: 


+ 3n 
| sen? (x)(x + cos? (x) — 1)dx = ——. « 
-> 4 
Teorema 7.56. Em um espaço com produto interno, se n vetores v1,..., Vn São ortogonais a um outro vetor W, 


então todas as combinações lineares dos vetores v; também são ortogonais a w. 


Demonstração. As combinações lineares dos v; são «yv1 +- - -+ &2Vn. O produto de uma combinação linear 
dos v; com w é 


(oqvi ++ Va, W) 
= (1V1, W) +: + (On Vo, W) 


=% (vi, w) +o EAn (Vn, W) 
que é zero, porque todos os produtos são zero. E 


Exemplo 7.57. Em Rê com o produto interno usual, os vetores 


Vide (2, 0, 0)" 

V2 = (0; 1,0)" 
são ortogonais ao vetor v3: 

V3 = (0,0,3)". 


Qualquer combinação linear de vı e vz também será ortogonal a v3: 


avı + bv; = (2a, b,0)!. 
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Verificamos que o produto interno de vs com (2a, b, 0)" é zero: 


Geometricamente, temos vı e vz no plano por onde passam os eixos x e y: 


Z 


T y 


O vetor v; está sobre o eixo z. Algumas combinações lineares de vı e vz são mostradas na figura - são os 
vetores tracejados. Claramente, todas ficam no mesmo plano, perpendicular a v3. < 


Definição 7.58 (Base ortogonal). Uma base para um espaço vetorial com produto interno é ortogonal se 
seus vetores são todos ortogonais entre si. + 


Exemplo 7.59. Os vetores (—2,1)! e (2,4)! formam uma base ortogonal para R?. < 


Definição 7.60 (Base ortonormal). Uma base para um espaço vetorial com produto interno é ortonormal se 
é ortogonal e todos os seus vetores tem norma igual a um. + 


Exemplo 7.61. A base canônica em R” é ortonormal. « 


A base canônica não é a única base ortonormal, como mostra o exemplo a seguir. 


Epa Ds m 
v2 v2 


são claramente LI (e portanto base para R?). 


Os dois vetores são ortogonais: 
1 
(5 5) Aio 
VARAG" 


Finalmente, a norma de ambos é igual a um: 


TE 


Exemplo 7.62. Os vetores 
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e o) (8) 1 


e portanto os dois vetores formam uma base ortonormal. « 
Teorema 7.63. Se B = (by,bz,...,bn) é uma base ortonormal para um espaço V, então para todo v € V, 
v= 2 (v, bi) bi. 


Exemplo 7.64. Seja B = ((0,0,1)",(0,1,0)",(0,0,1)"). Então o vetor (2,4,5)! é 


(2,4,5)! = (0,0, 1)", (2,4,5)") (0,0,1)" 

+ ((0,1,0)",(2,4,5)") (0,1,0)" 
+ ((1,0,0)", (2,4,5)") (1,0,0)" 
= (5,0,0)! + (0,4,0)" + (1,0,0)". « 


Exemplo 7.65. Seja 


Então o vetor (—2, 5)" 


Il 
T 
NIW 
NIW 
O ne 
— 

+ 

| 
NIN 
NIN 
OR 
+ 

À 


7.3 Projeções 


Em Geometria Analítica definimos a projeção de um vetor v sobre uma reta r como o vetor v’ tal que 
u = v — v’ é perpendicular a r (ou ainda, o vetor u é paralelo a uma reta s perpendicular a r). 

Mas sabemos que uma reta é um subespaço de R2, e que nessa definição de projeção, vetores der e s são 
ortogonais entre si (o ângulo entre eles será sempre 7/2). Como cada um desses subespaços tem dimensão 
um, e a interseção deles é somente a origem, concluímos que R? é soma direta desses dois subespaços. 

Assim, revisamos o conceito de projeção: falamos agora de projeção de um vetor de um espaço V em 
um subespaço de V. 


Definição 7.66 (Projeção). Sejam U, V e W espaços vetoriais tais que V = U & W. Um operador linear 
em T é uma projeção em U se e somente se, para todo v = u + w, comu € Ue w € W, T(v)=u. + 


Exemplo 7.67. < 
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Exemplo 7.68. Em R?, o operador linear 


Leu" = (x, 3x)" 


é uma projeção no subespaço igual à reta y = 3x. Todo vetor em R? pode ser escrito como soma 
(x,3x)" + (0, a)", 


e o operador T sempre nos dará o componente (x, 3x)". Geometricamente: temos um vetor qualquer, por 
exemplo, (2,2)". A transformação levará em (2, 6)", que fica sobre a reta (x, 3x)": 


w : (2,6) 
u 
v : (2,2) 


< 


Exemplo 7.69. Em Rt, O operador T(x1,x2,x3,x4)! = (x1, x2, 0,0)! é uma projeção no subespaço de 
Rº gerado por (a, b,0,0)!. « 


Exemplo 7.70. Em Ry [x], o de polinômios de grau 4, o operador T que elimina o termo com coeficiente x? 
é uma projeção. Sabemos que 
Raik] = R[x] @ {axt :a € R}, 


e o operador descrito leva qualquer polinômio de grau 4no componente em Rê. Por exemplo, 
$$ 23 +1= (38) +(—23+1). 
O operador T leva o polinômio à sua componente de grau 3: 
T(3xf — 2x? +1) = 2 + 1. « 


Uma vez que um vetor tenha sido projetado em um subespaço, o operador de projeção não mais o 
modificará. Similarmente, se um vetor não é modificado pelo operador de projeção, ele já deve pertencer 
ao subespaço onde o operador projeta. 


Teorema 7.71. Um operador linear T é uma projeção se e somente se T = To T (ou, na forma matricial, T = T?). 
Também dizemos que T é idempotente. 
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Exemplo 7.72. O operador 


é idempotente: 
Re MRE 0) = (1 o). 
10/41 0 10 


Também podemos verificar que T é uma projeção: seja v = (x1, x2)". Então 


wi Orey C) 


e vetores são projetados por T na reta (x, x 


Exemplo 7.73. O operador definido no espaço R4[x], no Exemplo é, em forma matricial, 


00000 
01000 
T7=/00100 
00000 
00010 
00001 


Para aplicar Temum polinômio aux! + a3x? + azx? + aıx + xo, usamos suas coordenadas: 


T(agx* + azx2 4 ax? 4 aıx + xo} = T (a4, a3, a2, a1, ao)! 
00000 a4 0 
01000 as az 
—-]|0 0100 aœol=la]l, 
00000 2 
o o Quo] (MN ai 
00001 ao ao 
que são as coordenadas de 0x4 + a3x? + a2x? + a1x + xo: 
Verificamos que a matriz do operador é idempotente: 
00000 00000 00000 
01000 01000 01000 
T22-/00100 00100]-/0010 0] -7T 
00000 00000 00000 
00010 00010 00010 
00001 00001 000071 


Definição 7.74 (Complemento ortogonal). Seja V um espaço vetorial e W um subespaço de V. O comple- 
mento ortogonal de W é o subespaço denotado W+ tal que todo vetor de W é ortogonal a todo vetor de 


wt, 


+ 


Exemplo 7.75. Em R?, o subespaço U gerado por (x,3x)" é uma reta. Seu complemento ortogonal é o 


subespaço V gerado por (x, —x/3)! - que é a reta perpendicular a U. 
P 8 P q P 
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U: (x,3x) 


V : (x, —x/3) 


Quaisquer duas retas perpendiculares em R? passando pela origem formam um exemplo de subespaço com 
complemento ortogonal. < 


Exemplo 7.76. Em R?, o complemento ortogonal de uma reta é um plano, e o de um plano é uma reta. « 
Definição 7.77 (Projeção ortogonal). Seja v um vetor em um espaço vetorial. Se 

v=p+kw, 
com p e w ortogonais, dizemos p é a projeção ortogonal de v em w. + 


Exemplo 7.78. Na figura a seguir, vı = (4,2)! e v2 = (7,8)!. 


O vetor tracejado, exibido como se indo de v3 até v2 na figura da esquerda, é a projeção ortogonal de vz em 
vı. Ele pertence ao mesmo subespaço que vı, embora esteja representado de forma paralela a ele, longe da 
origem - a figura da direita mostra que este vetor é de fato a projeção de vz em v1, formando um ângulo 
reto. Observe que 

º“ V3 =v — ye 

* (v1, v3) = 0 (são ortogonais). « 


Teorema 7.79. Para todo ve w Æ O em um espaço vetorial, existe uma projeção ortogonal de v em w, dada unica- 
mente por 


Proj, (v) = w. 
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Demonstração. Primeiro verificamos que v — Proj, (v) de fato resulta em vetor ortogonal a w. 


u = v — Proj, (v) 


(w, w) (produto interno com w) 


Para verificar que esta forma é única, observamos que v = u + kw. Calculando o produto interno com w, 
obtemos 
(v, w) = (u, w) T k(w, w), 


mas como u e w são ortogonais, temos 


determinando unicamente k. E 
Exemplo 7.80. No exemplo obtemos a projeção ortogonal usando a fórmula dada no teorema: 


v3 =v2 — Proj, (v2) 


=” (vi 92) 4 


Exemplo 7.81. Em Rº, sejam 
w= (1,2,0)", v = (2,1,1)! 


Os vetores não são ortogonais (seu produto interno é 4). 
Usando a projeção ortogonal de v em w obtemos 


u = v — Proj, (v) 


o wy) 
TY (ww) 
T ((1,2,0)!, (2,1; DO T 
= (2,1,1) ((1,2,0)T, (1,2,0 Ty (1,2,0) 
= (21,055 01,2,0]7 
T 
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Então v = p + kw, e como podemos verificar, p e w são ortogonais: 


' 
tm = ((5,-51) LoT) =o á 


Exemplo 7.82. No espaço C? [—1, 1] das funções contínuas entre —1 e 1, podemos definir o produto interno 
como 


1 
g=] fogba 
=1 
Neste espaço, as funções f(x) = x? e In(x + 2) não são ortogonais, porque 


1 
| x? In(x + 2)dx = 21n(3) — T 
—1 


Podemos obter uma função ortogonal a g. Basta calcular a projeção ortogonal de f em g: 


= (g, f) lT (x2, In(x + 2)) 
"= Ag) tD, ne) 
=x? Eai nW? ln(x + 2). < 
31n (3) — 6log(3) + 4 


O exercício|224|pede a demonstração do teorema 
Teorema 7.83. Seja W subespaço de um espaço vetorial V. Então V = W ẹ W+. 


Definição 7.84 (Projeção ortogonal em subespaço). Seja W subespaço de um espaço vetorial V. Uma 


projeção de um vetor w € W em WŁ é uma projeção ortogonal de v em W. + 
Teorema 7.85. Seja W subespaço de um espaço vetorial V, e {w1, W2,..., Wx} uma base ortogonal de W. O 
operador 
' (w1, v) (wk, V) 
Projw(v) = Wi + A W 
did (w1, W1) i (Wk, Wk) 


realiza a projeção ortogonal de um vetor v-€ V pelo subespaço W: v — Projw(v) € WŁ. 


Exemplo 7.86. Sejabı = (0, 1,0)", b2 = (2,0,0)! uma base para um subespaço W de R? com dimensão 
2. Considere o vetor v = (3, 3,4)" em Rº. Calculamos agora sua projeção em W. 
Antes de começarmos, pré-calculamos: 


(b1,b1) =1 
(b2,b2) = 4. 
Calculamos agora a projeção de v. 
; (bi, v) (b2,v) 
P = bı 4 b 
O (bi bi) | (bz,b2) ? 


((2,0,0)", (3,3,4) ") 
4 


= ((0,1,0)", (3,3,4)") b1 t b2 
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=3b, + 302 


= (0,3,0)! T (3,0,0)! 
= (3,3,0)" 


Definimos 
u = v — Projgz (v) = (3,3,4)! —(3,3,0)! = (0,0,4)!. 


Verificamos que (0, 0,4)! é ortogonal a todos os vetores de W. Vetores em W são da forma 


w = abı + b2 
= (0, a, 0)" T (2b, 0, 0)" 
= (2b, a, 0)" 
O produto interno de (0, 0,4)" com w € W será sempre igual a 0 - (2b) + 0a +0-4=0. « 


7.4 Ortogonalização 


A partir de uma base não ortogonal, podemos obter uma base ortogonal usando o processo de ortogonalização 
de Gram-Schmidt. 


Teorema 7.87. Todo espaço vetorial de dimensão finita tem uma base ortogonal. 


Demonstração. Todo espaço vetorial de dimensão finita tem uma base. Presumimos que seja dada uma base 
não ortogonal, by, bz,..., bn para um espaço vetorial. Para obter uma base ortogonal c1, c2,..., Cn, CO- 
meçamos incluíndo by na nova base: 


cy =b]; 
Agora suponha que já temos k vetores ortogonais. O k-ésimo vetor c deve ser ortogonal a todos os ante- 
riores, C1, C2,..., Ck-1. Escrevemos uma combinação linear destes vetores que já temos na base com by: 
Ck = bk +a1c1 + a2c2 +---+ ac. (7.1) 


Queremos que c; e c, sejam ortogonais, portanto 


(cr, ck) =0 (7.2) 
(C2,Ck) =0 


(cri , ck) =0 
Substituímos c;, como definido na equação[7.1] nas equações[7.2] 


(crbr + aci + a2c2 +-+: +ac ici) = 


(c2,bk + a1cı +azc +: + ak—1Ck—1) = 
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(ce-1,bk + aic + arco +-+ + ak—1Ck—1) =0 
Tomamos uma destas equações. Temos 


(ci, bk + a1C1 + A2C2 +: + ak—1Ck— 1) 
(ci, Dk) + (ci, a1c1) + (c1, a202) +++- + (Ci ak—1Ck—1) = 
(ci, bk) + ay (ci, c1) + az (cc) +-+- + ak1 (cock) 

(ci, bx) + ai (cici) 


porque os k — 1 vetores anteriores são ortogonais entre si. Com isso obtemos 


(ci, bk) 
CAE 


Qi = 


Podemos agora substituir os valores de a; na equação[7.1] Determinamos portanto que o vetor cy é 


Ck = ac + a2C2 +: + ak—1Ck—1 + bk 
tr — WPA Eb o aNd) | m 
(C1,€1) (C2, C2) (Cu bp) 


A demonstração do teoremal7.87|é construtiva, e nos dá um método para conseguir uma base ortogonal 
a partir de uma base qualquer. 


Método 7.88 (Ortogonalização de Gram-Schmidt). Sejam by,...,bx uma base qualquer para um espaço 
vetorial. Podemos calcular, um a um, os vetores de uma base ortogonal para o mesmo espaço usando o 
processo de Gram-Schmidt: 


Cı = bı 

A (ers Bal 
lenc) 

c3 =b; (cz,bs) SPs) o, 
lezca) (C1,C1) 


ace COM 


fox (eu Ch) 
Se quisermos uma base ortonormal, calculamos 
C1 
G = 
Ilc |l 
c2 
e= 
Ilc2ll 
c 
ck =Ý ° 


lex 
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Exemplo 7.89. Usaremos o algoritmo de Gram-Schmidt na seguinte base não ortogonal de R3: 


O primeiro vetor da base ortogonal será iguala by: 


O segundo vetor é 


O terceiro vetor é 


C3 =b; 


=(=} 


bı = (1,0, —2)" 
b2 EE (=) 
bs = (1,-1,0)" 


=b; = (1,0, —2)" 
p _ (c&,b2) 
RD (c1,€1) 
F, 12)", (2,-2,2)") T 
A A0 2 O 
(2,-2,2) EO, 237 
A w 72 as T 
Er (2, 20) (5:05) 
T 


(c2;b3) 1 (eba) 
(C2,C2) (c1,c1) 
1 o)" ((2,—2,2)", (1 ,—1,0) T) (2, 2 2" ((1,0, 2)", (1,—1 09") (1 0 2)" 
N g2, —2,2)T, (2; —2,2) T ((1,0, )T, (1,0, 2)1) f 
22/5 (1 6U 1 
ga 2 Ed 2! 
K9 AG 5) 5(b Bica) 
1/12 o" 41 xo) 
T psd o 
1,0) z(o) + (50-5) 
T T 
1,0)" A ENa T lo 
35º 14 70 5 5 
1 3 1g 
7 14º 14) 


Verificamos que os vetores são de fato ortogonais: 


(c1,02) = 
(C1,03) = 
(C2,C3) = 


(1,0, —2)(12/5, =2, 6/5)" 


(1,0, —2)( 
(12/5, —2, 6/5)(—1/7, —3/14, —1/14)" 


1/7, 


3/14, 


=12/5+0-12/5=0. 


1/14)! 


=—1/7+0+2/14=0. 
= —12/35 + 3/7 — 3/35 = 0. 
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Se quisermos uma base ortonormal, 


dE = = (Too) 

j= ci as 1Y) = y” V5 

di = (= E (E a) 6 5 3 Ò 
2 lel 2/7715" 25) — (5V1 VIA V5VA 


T T 
TER E a E A Sal p 
7 14 14 7 I4 14 


Exemplo 7.90. No espaço C?[0, 1], as combinações lineares de fı (x) = x e f2 (x) = e* são base para um 
subespaço, contendo as funções da forma ax + be*. Esta base, no entanto, não é ortogonal se usarmos o 
produto interno que definimos anteriormente para funções: 


1 
(x, e*) > xe*dx=1. 
0 
Usamos o processo de ortogonalização de Gram-Schmidt para obter uma base ortogonal. O primeiro vetor 
será gı (x) = fi (x) = x. O segundo vetor é 


(gi (x)fz(x)) 
x) = f2(x) — >>> gi (x 
NO 2- tar ir a) 
x_ e~) 
= e€ — 
(x, x) 
ne [i xe*dx 
fi x? dx 
1 
e qa e Se 
Agora verificamos que as funções gı (x) e g2(x) são ortogonais: 
1 
(91,92) = (et — 3x) = | x(e* — 3x)dx = 0. < 
0 


7.5  Diagonalização de matrizes simétricas 


Matrizes reais simétricas (e complexas Hermitianas) tem propriedades importantes relacionadas à sua di- 
agonalização e ortogonalidade. Estas propriedades são relevantes, por exemplo, no estudo de formas qua- 
dráticas realizado no Capítulo[12] 


Teorema 7.91. Os autovalores de uma matriz real simétrica são todos reais. 


Exemplo 7.92. Os autovalores da matriz 
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—-3 21 
2 3 1 
1 11 


tem autovalores —v'3, 3, —5. « 


são 3e —7, ambos reais. A matriz 


Definição 7.93 (matriz ortogonalmente diagonalizável). Uma matriz A é ortogonalmente diagonalizável se 
A = PDP”!, com D diagonal e P ortogonal. + 


Teorema 7.94. Uma matriz é ortogonalmente diagonalizável se e somente se é simétrica. 


Demonstração. (=> apenas) Seja A uma matriz ortogonalmente diagonalizável, com A = PDPT!. Usando 
o fato de que P7! = PT , mostramos que A é simétrica 


A = PDP! = PD'P! = (P')D' P! = (PDPIN = AT. E 


y-a 


é simétrica, e portanto diagonalizável. De fato, A = PDP-!, 


Exemplo 7.95. A matriz 


v2+1 __1 
a=( 1 1 EF O) (2 ia < 
— 2—1 1 ; 
Lay Dal v2 0 Ve a 


As colunas da matriz P são ortogonais: 


(11-v2) ( A =0. 


Corolário 7.96. Toda matriz simétrica é diagonalizável. 


Se uma matriz simétrica A = PDP”! , nem sempre as colunas de P obtidas imediatamente do processo 
de diagonalização serão ortogonais. Duas colunas serão ortogonais quando pertencerem a autovalores 
distintos. 


Teorema 7.97. Seja A uma matriz simétrica. Quaisquer dois autovetores pertencentes a autovalores distintos de 
A são ortogonais entre si. 


Podemos, no entanto, usar o processo de ortogonalização de Gram-Schmidt para obter uma nova matriz 
ortogonal que também diagonaliza a mesma matriz simétrica. 


Teorema 7.98. Seja A uma matriz simétrica, com A = PDP]. Seja R o resultado do processo de Gram-Schmit 
aplicado nas colunas de A. Seja S a matriz obtida de R pela normalização dos vetores em cada coluna. Então 


A = RDR! = RDR! 
= ŞDS7! = SDS". 


300 CAPÍTULO 7. PRODUTO INTERNO 


7.6 Produto interno em espaços complexos 


Nesta seção tratamos brevemente de espaços sobre corpos complexos. Será necessário relembrar, por- 
tanto, a definição e notação para conjugado. 
Definição 7.99 (Conjugado de binômio e de número complexo). Seja a + z um binômio. Seu conjugado é 
a— z. Seaérealez = bi imaginário, então a + z = a + bi é complexo, e o conjugado de x = a + bi é 
x=a-bi, + 


No início do Capítulo demos a definição de produto interno para espaços vetoriais sobre o corpo dos 
reais. Em espaços complexos definimos produto interno de forma mais geral: o produto não precisa ser 
comutativo, mas deve respeitar a seguinte regra de simetria: 


* simetria: (u, v) = (v, u). 
* positividade: (v, v) > 0, e (0,0) = 0. 
* linearidade: para todo escalar k e vetores u, v, w, 
(u+ w,v) = (u, v) + (w, v) 
(ku, v) = k (u, v) 
Observamos que para números a + bi onde b = 0, esta definição equivale àquela que demos para 
espaços reais. O produto interno deve ser linear somente no primeiro argumento. Para espaços reais, isso 


implica na linearidade também no segundo argumento, porque nesses espaços o produto é comutativo. Em 
espaços complexos, o produto não é comutativo. 


Exemplo 7.100. Em C”, 

(x,y) = X191 + x292 +: +XnUn 
é produto interno. < 
Exemplo 7.101. No espaço de funções contínuas de C em C definidas no intervalo [0, 1], 


b 
(£,9) =| TR 


é produto interno. < 


Teorema 7.102. Sejam A uma matriz complexa m x n, x € C™, y € CT, e seja (-, -} o produto interno complexo 


definido no exemplo[7.101] Então 
(Ax,y) = (x, A™y). 


7.7 Aplicações 
7.71 Solução de sistemas lineares e mínimos quadrados [ distância; pro- 
jeção ] 


Se um sistema Ax = b é incompatível, podemos querer encontrar algum vetor x tão próximo quanto 
possível de uma solução para o sistema. Definimos que um vetor z é o mais próxima possível de uma 
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solução se minimiza o quadrado do erro. O erro de que falamos é a distância entre b e Az, ou seja, 


d(b, Az)? = |b — Azl/? 
= Db: — (Ax);)?. 


Definição 7.103 (Solução minimizando quadrados). Uma solução minimizando quadrados para o sistema 
Ax = b é o vetor z que minimiza |b — Az|| > |lb — Ayll. + 


Suponha que Ax = b é incompatível, e que W é o espaço coluna de A. Certamente b ¢ W, de outra 
forma b seria combinação linear das colunas de A, e os coeficientes desta combinação linear nos dariam 
uma solução para o sistema. 

Tendo definido a noção de distância neste espaço, no entanto, observamos que no espaço coluna de 
A podemos tomar o vetor mais próximo a b: este será obtido a partir da projeção ortogonal de b em W. 
Assim, se resolvermos 

Ax =b — Projw(b) 


obteremos a solução minimizando quadrados. 
Nem sempre, no entanto, é fácil determinar Projy (b). O Teoremal7.104)permite determinar de maneira 
simples uma solução minimizando quadrados. 


Teorema 7.104. Qualquer solução minimizando quadrados para Ax = b é uma solução para o sistema A! Ax = 
ATb, e qualquer solução para A! Ax = A! b é solução minimizando quadrados para Ax = b. 


3-0) 


é incompatível. Para encontrarmos uma solução minimizando quadrados, calculamos 


Exemplo 7.105. O sistema 


e resolvemos ATAx = ATb: 


e obtemos a solução 


1 
-lfs 
“A e 


que é solução minimizando quadrados para o sistema original. < 


7.7.2 Covariância e correlação [ produto interno; ângulo | 


O conjunto de todas as variáveis aleatórias relacionadas a um mesmo experimento que tenham variância 
finita formam um espaço vetorial com as operações usuais de soma de variáveis aleatórias e multiplicação 
de uma variável por número real. (veja o exemplo [1.39] e o exercício Bo}. A esperança de uma variável 
aleatória é uma transformação linear que podemos usar para determinar o valor ao redor do qual uma 
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variável aleatória flutua - mas a esperança não nos diz quão distantes os valores podem ser entre si. Nos 
interessa, então, a distância entre a variável aleatória e sua esperança, E(|X — E(X)|). Como a função 
módulo impõe certas dificuldades, usamos a raiz quadrada do quadrado de X — E(X), e definimos o desvio 
padrão. 


Definição 7.106 (Desvio padrão). Seja X uma variável aleatória. Então o desvio padrão de X é 


ox = +y [E(X — E(X))P + 


Exemplo 7.107. < 


Sejam X e Y duas variáveis aleatórias relacionadas ao mesmo experimento. Definimos o produto interno 


(X,Y) =E(XY)=}_ 5 xyPrix =xPr[Y =y]. 
x y 


Exemplo 7.108. < 


Estamos agora interessados em quão semelhante é a variação de duas variáveis aleatórias - se valores 
altos de uma correspondem com os valores altos da outra, e vice-versa. Usamos novamente a distância 
entre a variável e sua esperança, X—E(X) e Y—E(Y). Intuitivamente, se o produto interno dessas distâncias 
for grande, então X e Y são fortemente correlacionadas. Se for zero, as variáveis não são correlacionadas. 


Definição 7.109 (Covariância e Variância). A covariância entre X e Y é o produto interno da variável alea- 
tória X — E(X) com a variável aleatória Y — E(Y): 


cov(X, Y) = (X — E(X), Y — E(Y)) 
= E| (X — E(X))(Y — E(Y))] 


A variância de uma variável aletória X, que denotamos por a; é a covariância de X com ela mesma. 


cov(X,X) = (X — E(X), X — E(X)) 
= E[(X — E(X))(X — E(X) )] 


Covariância zero não implica, no entanto, em independência, como ilustrado no exemplo|7.110 


Exemplo 7.110. Sejam A, B e C variáveis aletórias definidas da seguinte forma: 


1 1 
1 1 
C=AB 


É fácil verificar que cov(A, B) = O (obseve que a esperança de A é 1/2, e a de C é 0). No entanto, por 
definição, para que A e C sejam independentes seria necessário que 


Pr[Č = clA = a] = Pr[C = cl, 
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para todos ae c. Se tomarmos a = 0ec=1, 


Pr[C = 1[A = 0] = Pr[AB = 14A = 0] = 0 
1 
4º 


Pr[C = 1] = Pr[AB = 1] 


e as variáveis A e C não são independentes, embora tenham covariância zero. < 


A magnitude da covariância não é fácil de interpretar, portanto faz sentido que normalizemos para 
obter um valor entre —1 e 1, como observamos ao definir ângulos na seção[7.2] 


Definição 7.111 (Coeficiente de correlação). Se definirmos Ax = (xı — E(X), ..., Xn — E(X)) e Ay = 
(yı — E(Y),...,Un — E(Y)), o coeficiente de correlação entre X e Y é o cosseno do ânguld'Jentre Ax e Ay. 


(X —- E(X), Y -E(Y) 
IX — E(X)II IY — EM) 
(X - E(X), Y - EMV)) 


= i, + 


ALém de interpretar o coeficiente de correlação como ângulo entre os vetores de dados, podemos ob- 
servar outro significado para ele. Regressão linear é uma forma de modelar a relação entre duas variáveis a 
partir de dados observados, quando supomos que as duas variáveis são relacionadas, e que esta relação é 
linear. Uma linha de regressão linear é uma equação da forma 


Y=qa+pÞbX. 


Pode-se obter por exemplo a reta que melhor se ajusta aos dados usando o método dos mínimos quadrados 
(ou seja, minimizando a soma dos quadrados das distâncias de cada ponto até a reta, na direção vertical). 

Se obtivermos uma linha de regressão que nos permita predizer X a partir de Y e outra que nos per- 
mita predizer Y a partir de X, o coeficiente de correlação é o cosseno do ângulo entre estas duas linhas de 
regressão (a + bX e a + BY). 


7.7.3  Covariância [| produto interno; matriz de Gram ] 


Se X é um vetor onde cada elemento é uma variável aleatória, chamamos a matriz de Gram de X de 
matriz de covariância: 


Li = cov(X;, Xj) = (Xi, Xj) = El(X; — E(X:))(X; — E(X;))). 


*Há diversas maneiras de interpretar o coeficiente de correlação. Um artigo de Josph Lee Rogers e W. Alan Nicewander mostra 


treze delas [Rnss). 
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Desta forma, temos 


E(X1 — E(X1))(X1 — E(X1))]] (X1 — E(X1))(X> — E(X2)) (X1 — E(X1)(Xn — E(Xn)) 
5 | EIX- E(X2))(X1 -E(X1))] (X2 — E(X2))(X2 — E(X2)) = (X2 — E(X2))(Xn — E(Xn)) 
2X — E(Xn))(X1 —E(X1)] (Xn — E(Xn))(X2 — E(X2)) =- (Xn — E(Xn))(Xn — E(Xn)) 


A diagonal da matriz de covariância claramente nos informa as variâncias: Zii = cov(Xi, X1) = 0? (X1). 
7.74 Otimização linear (affine scaling) [ projeção, núcleo, escala ] 


(Esta seção é apenas um rascunho) 

Este exemplo trata de otimização linear, já abordada na seção[4.8.2](naquela seção pode-se encontrar a 
definição de prblema de otimização linear - definição [4.110]- e um exemplo). 

Há um método para resolução de problemas de programação linear no qual a operação de projeção é 
essencial, 

A idéia é seguir o gradiente do objetivo até chegar a uma solução ótima. Suponha que inicialmente 
temos uma solução inicial xº. Observe que por solução viável entendemos uma solução do sistema 


Ax =b. 


Os pontos x são os pontos dentro da região viável. 

O método de affine scaling começa com uma solução inicial xº, muda a escala do problema, mudando 
também a escala de x? e obtendo yº. Em seguida obtem uma solução melhor y!. Desfaz a mudança de 
escala e obtem uma nova solução x! para o problema original. 

Usaremos um exemplo prático no desenvolvimento. Queremos resolver o seguinte problema: 


max 2x, + x2 
sujeito a xy — x2 < 2 
xı +2x2 < 8 
x2 <3 
x>0. 


Podemos expressá-lo na forma Ax = b, já que 
ax + a2X2 +--+ anXn < b 


é o mesmo que 
aıxı + a2Xx2 +: +anXn +s =b, s>0 


Temos portanto 
max 2xı + x2 


sujeito a x1 — X2 + x3 = 2 
xı +2x2 +x4 =8 


x2+x5 =3 
x>0, 
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1 -1100 2 
A=|1 2010)» b=f[{8]. 
0 1001 3 


O problema com o qual iniciamos envolvia apenas duas variáveis, e por isso podíamos reprsentá-lo facil- 
mente no plano. Mantendo em mente que x3, x4, x5 são variáveis de folga podemos, mesmo na forma de 
igualdade, visualizar as restrições no plano. 

Suponha que tenhamos começado com a solução xı = 1/2, x2 = 5/2. Para representar este ponto 
com variáveis de folga, escrevemos 


e temos 


1/2 
5/2 
4 
5/2 
1/2 


com x3 = 4, x4 = 5/2, e x5 = 1/2. Estas são as folgas de cada desigualdade quando xı = 1/2 e x2 = 5/2, 
porque 


xXı — X2 +x3=2 xı +2x2 +x4 = 8 x2+x5 =3 
(1/2) — (5/2) +x3 =2 (1/2) + 2(5/2) + x4 =8 (5/2) +x5 =3 
x3=4 x4 = 5/2 x5 = 1/2 


Podemos calcular o gradiente da função objetivo, Vf, que é um vetor, e somá-lo a xº para tentar chegar 
mais perto da solução ótima. No entanto, se xº estiver muito perto da borda, seguir o gradiente do objetivo 
poderá não ser útil: 


Mudamos a escala de xo e das restrições, de forma a transformar o ponto xo no ponto (1,1,...,1)!. Para 
isto usamos a matriz de escala 


D = diag(x1,x2,...,Xn) = 
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O ponto modificado é y? = D-!xº, logo 


1/2 i 
5/2 1 
=D") 4 |=|1 
5/2 1 
1/2 l 
Como aplicamos a transformação no ponto, podemos reescrever Ax = b como A (Dy) = b, ou 
(AD)y =b. 
Renomeamos 
1/1 -5800 
Q=AD=5|1 10050 
0 5001 


Como x = Dy, a função objetivo passa a ser 
(2, 1,0,0, 0)x 
(2, 1,0,0, 0)(Dy) 
= [(2, 1,0, 0, 0)D]y 
(1,5/2, 0, 0, 0)y. 


c'x = 


e temos um novo problema de otimização 


max yı + y p 
sujeitoa Qy = b 
yz0 
Assim como x° era viável, y? também é para este novo problema. 
As restrições do novo sistema são 


ou, 
Yı = 5y2 +8y3 =4 substituindo Yı —3y2 + z3 =4 
y1 + 10y2 + 5y4 = 16 yı + 10y2 + z4 = 16 
5y2 +yYy5 =6 Za = 8y3 y2 +z5 — 6/5 
Z4 = 594, 


Se tratarmos za, Z4, Z5 como variáveis de folga, estas restrições definem a região representada n afigura a 


seguir. 


j 


oN 
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Como xo = Dy, o gradiente de c" xo é 


O operador que projeta no kernel de A é 
P=T-DA!(AD?AT) !'AD. 


Agora sim, um passo na direção do gradiente do objetivo certamente será benéfico. Há, no entanto, um 
problema: não sabemos que tamanho de passo podemos dar! Se o passo for muito longo, poderemos obter 
um ponto fora da região viável. 

Uma solução para isto é não andar diretamente na direção do gradiente. Primeiro projetamos o gradi- 
ente no espaço nulo (núcleo) de A: 

d= Proj À (Vt) 


Agora temos uma direção d (um vetor pode ser encarado como uma “direção”) para a qual podemos mover 
nossa solução. Esta projeção terá a mesma direção do gradiente, portanto melhorará a solução. Mas como 
foi projetada no espaço nulo de A, o novo vetor continuará sendo solução para Ax = b, porque o vetor 
projetado no espaço nulo é solução de Ax = 0 (por definição de espaço nulo), e a soma de uma solução 
do sistema homogêneo com uma solução do sistema não-homogêneo continua sendo solução para o não- 
homogêneo. 


Exercícios 

Ex. 207 — Mostre que são ou que não são produtos internos: 
a) Em C'[0, 1], (f, g) = fo f(x)g'(x)dx. 
b) Em C! [0,1], (f, g) = f f'(x)g(x)dx. 
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c)Em C! 
d) Em C! 
e) Em C! 
f) Em C? 
g) Em Cº 
h) Em C? 
i) Em Cº 


pEmR”, 
q) EmR”, 
r) Em R”, 
s) Em C*, 
t) Em R”, 


0,1 
0,1 
0,1 
0,1 
0,1 
0,1 
0,1 
j) Em Mrnxn, 
k) Em Mnxn, 


det(A) + det(B). 
= Tr(AB). 


p(x) E anx” T; anx"! qae 


q(x) = bnx™ + box"! +... 


+aıx + bo 
+ bıx + bo 
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r(x) = anbıx™ + an—1b2x™! +- + abr ix + dobna 


r(x), onde 
p(x) = Anx” F dp ++ qx+ bo 
q(x) =bn x T+ bax"! +7 bix + bo 
n n—1 
ro) = aber + Tabor 
i=0 i=0 
= r(x), onde 


q(x) = bax” +bn-1x" + 


+ bixd 


+ ax+bo 


H bo 


+---+ ayagbi box + aobo 


r(x) = lanbn x” a lan-1 bao Pia ses layby x + laobol 


= 0x" y, onde 0 é o ângulo entre x e y. 
y 8 y 


= axly, onde « é uma constante. 
xy!) + det(yx!). 


Ex. 208 — As sequências reais convergentes formam um espaço vetorial. Neste espaço, defina o produto 


interno 


f((an), (bn)) = 


(AB), 


quando (an) > A e bn — B. Determine se f é produto interno. 
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Ex. 209 — Para que valores de z o conjunto de funções (sen FX), definidas em [0, L], é ortogonal? 


Ex. 210 — Prove que em qualquer espaço vetorial, os vetores Ijullv + Ilvilu e |Jullv — ||vilu são ortogonais. 
Ex. 211 — Demonstre a proposição 
Ex. 212 — Demonstre o teoremal7.40| 


Ex. 213 — Explique como encontrar qualquer quantidade de vetores ortogonais em C[—7, 7t] usando o 
produto interno usual f” f(x)g(x)dx. 


Ex. 214 — Seja A uma matriz diagonalizada (suas entradas diagonais são seus autovalores, o resto da ma- 
triz tem zeros). Que matrizes serão ortogonais a À se usarmos o produto de Frobenius? 


Ex. 215 — Seja 
F=[1,cosx,senx,cos? x) 
um conjunto de funções reais. 
i) Prove que F é um conjunto LI. 
ii) F gera um espaço vetorial, Encontre para este espaço uma base ortonormal com relação ao produto 


1 27 
(ho) = zz |, Hogar 


Ex. 216 — Como a base do exemplo foi obtida? (Que relação ela tem com a base canônica?) 


Ex. 217 — Use o processo de ortogonalização de Gram-Schmidt para obter uma base para o espaço das 


matrizes 2 x 2, a partir da base 


Ex. 218 — Em Cº[1, e], as funções fı (x) = x7 !, f2(x) = cos(x} e f3 (x) = ln(x) geram um subespaço. Use 
o processo de ortogonalização de Gram-Schmidt para obter uma base ortonormal para este subespaço. 


Ex. 219 — Na demonstração da proposição dissemos que Proj o Proj = Proj. Demonstre. 


Ex. 220 — Se uma matriz T representa uma projeção, é verdade que T! também é um operador de proje- 
ção? 


Ex. 221 — O espeço Rs x] pode ser decomposto em dois outros espaços: Rs [x] e U, tal que U contém o 
zero e os polinômios de grau 4 e 5. A derivada segunda sempre levará qualquer membro de Rs [x] em Rs [x]. 
No entanto, a derivada não é idempotente: 
d2 
dx2* 
mas quando a aplicamos novamente, obtemos d? /dx? (20x?) = 120x. Explique. Depois, exiba uma verda- 
deira projeção de Rs [x] em Rs [x] usando diferenciação. 


5 = 20x3, 
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Ex. 222 — Seja (an) a sequência das potências de dois, ou seja, an = 2”: 


a1 = 1/2 
az = 1/4 
az = 1/8 


Encontre uma sequência ortogonal a esta. 


Ex. 223 — Seja r uma reta em RŻ. Mostre que há infinitos operadores que fazem projeção em r. 
Ex. 224 — Demonstre o teoremal7.83| 


Ex. 225 — No espaço de funções contínuas definidas no intervalo [—a, a], qual é o complemento ortogonal 
do subespaço das funções constantes? 


Ex. 226 — Encontre duas funções LI em l2, obtendo assim um subespaço S. Depois use o processo de 
Gram-Schmidt para encontrar uma base ortogonal para S. 


Ex. 227 — Definimos espaço vetorial no primeiro Capítulo com duas operações - uma entre vetores (soma) 
e uma entre vetor e escalar (multiplicação). Agora considere um espaço vetorial qualquer com produto 
interno. Defina “produto de dois vetores” como 


vow=(v,w)lv+w] 
Um espaço vetorial com as operações de soma de vetores e o produto & é um corpo? 


Ex. 228 — Considere o espaço C? [a, b], das funções reais contínuas no intervalo [a, b]. Seja h uma função 
neste espaço (e portanto contínua em [a, b]). Determine se são produto interno nesse espaço: 


c) o h(y) (s? f()g(x)dx) dy, come < b— a. 


d) f(b)g(b) — f(a)g(a). 
e) f(g) + g) 


: f 
O lim sos AA, 


Ex. 229 — Determine a projeção ortogonal de f(x) = x em g(x) = sen(x), e mostre a função ortogonal a 
sen(x) que se obtém desta forma. 
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Ex. 230 — Podemos definir espaços de funções contínuas Cla, b] para qualquer intervalo [a, b]. Considere 
as funções 


Determine a e b tais que f e g sejam ortogonais em Cla, b], usando o produto interno usual fe f(x)g(x)dx. 


Ex. 231 — No exemplo[7.14Jexibimos um produto interno em para espaços de ciclos em um grafo. Podemos 
criar outro produto interno, trocando a soma em R pela soma em Z2 (ou seja, trocando soma usual por ou- 
exclusivo). Qual passaria a ser o significado desse produto interno? E o significado de dois grafos serem 
ortogonais? 


Ex. 232 — Releia a definição de matriz de Pascal no Exercício[140] (página [212) e dê uma forma fechada 
para o produto de duas de suas colunas i e j, em termos apenas dos índices i ej. 


Ex. 233 — Mostre que ângulo e distância medem, de maneiras diferentes, o mesmo conceito em grafos: 
dados grafos A, B, C, D, prove que se o ângulo entre A e B é maior que o ângulo entre C e D, então 
d(A,B) > d(C,D). 


Ex. 234 — Prove que qualquer isometria central é a composição de no máximo tres reflexões. 


Ex. 235 — Prove que qualquer isometria (central ou não) com um ponto fixo é uma rotação ou uma refle- 
xão. 


Ex. 236 — Sejam À e B dois grafos de ciclos disjuntos, não ortogonais. Quem é o grafo ortogonal a À que 
você consegue obter através de uma projeção ortogonal? Qual seria o resultado do processo de ortogona- 
lização de Gram-Schmidt em grafos de ciclos? 


Ex. 237 — Verifique que o Teoremal12.20|vale para matrizes complexas. 
que q p p 


Ex. 238 — Seja A uma matriz quadrada qualquer com colunas a1, ..., an. Mostre que 


Idet A| < | [lail 


Ex. 239 — Leia as seguintes definições. 


Definição 7.112 (combinação positiva). Uma combinação positiva de um conjunto de vetores é uma combi- 
nação linear destes vetores, tendo coeficientes não negativos. + 


Definição 7.113 (cone convexo). O cone convexo gerado por um conjunto de vetores é o conjunto de todas 
as combinações positivas daquele conjunto. + 


Usando estas definições, prove o Lema de Farkas para R?, usando argumento geométricd| 


Lema 7.114 (de Farkas). Sejam A uma matriz e b um vetor, sendo que o número de linhas de A é igual à quantidade 
de elementos de b. Então exatamente um dos dois sistemas a seguir tem solução. 


40 Lema de Farkas é válido em R”, mas a demonstração é mais difícil do que a pedida aqui para R2 
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i) Ax = b, para algum x > 0. 
i)y! A > 0 para algum y talqueb! y < 0. 


Capítulo 8 


Operadores Ortogonais e Normais 


Este Capítulo está incompleto 


8.1 Operadores Ortogonais 
Estudamos agora os operadores lineares que preservam distâncias e normas de vetores, e que portanto 
representam movimentos rígidos. 


Definição 8.1 (isometria). Em um espaço V com produto interno, uma função f : V — V é uma isometria 
se preserva distâncias, ou seja, 
d(v,w) = d(Tv, Tw). 


Uma isometria T é central se preserva a origem, isto é, se T(0) = 0, e é não central caso contrário. 
Isometrias são também chamadas de operadores ortogonais. + 


Trivialmente, como isometrias preservam distâncias, devem também preservar a distância entre um 
vetor e a origem (ou seja, sua norma). 


Proposição 8.2. Isometrias preservam norma de vetores, ou seja, se T é uma isometria em um espaço V, então para 
todov E V, 
(v, v) = (Tv, Tv). 


Teorema 8.3. Isometrias centrais são transformações lineares. Isometrias não centrais não são transformações li- 
neares. 


Demonstração. Demonstramos somente a segunda parte do enunciado, que é trivialmente verificada: uma 
função que leve zero em algo diferente de zero não pode ser linear. E 


Exemplo 8.4. No espaço das funções contínuas em [0, 1] com o produto interno usual, o operador que 
muda o sinal de uma função é uma isometria: sejam f e g funções em R. 


1 
a(-6-9)=1/], (-t+gPax = alg, t) = alf, g). 


Esta é também uma isometria central, porque não modifica a função constante zero. < 
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Exemplo 8.5. Dado um ângulo 0, o operador de rotação por 0 em R?, cuja matriz é 


e a 
sen O cos 8 


é uma isometria, e é central porque a rotação não modifica a origem. < 


R= ( 1 ud 
v2 \1/2 1 


representa uma isometria quando aplicada em vetores de R?: preserva norma de vetores. No entanto, esta 
matriz não preserva norma de matrizes, porque temos que mudar o produto interno: seja 


QUAR) 


P+(-22 +52 = 30. 


Exemplo 8.6. A matriz 


A norma de Frobenius para A é 


Aplicando a isometria, temos 


=" 1 —5/4 
BA = v2 (A y3) 


cuja norma é 


VÝ + (2V2 2 (-3V 22 + (5V2)? 
=2+4:2+9 -205.2 
=78. 


Embora a norma de Frobenius seja muito parecida com o produto interno usual para vetores, ela é diferente! 
< 


Exemplo 8.7. A transofmração 


é isometria quando aplicada em M3 x 2: se 
temos ||A|| = a? + b? +c? + d?. Mas 


com IJRA]| = |All. < 
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Exemplo 8.8. No espaço £2, de sequencias convergentes, a transformação f(an) = —(an) é isometria. O 
produto interno é preservado por esta transformação: 


oO oO 


(flan), f(bn)) = X (~ai)(—b1) = X (a)(bi) = (lan), (bn). « 


1 1 
Exemplo 8.9. < 


Teorema 8.10. Em um espaço vetorial com dimensão finita, a matriz de um operador representando uma isometria 
tem determinante +1. 


Demonstração. Se o determinante do operador for diferente de +1, ele modificaria a norma de vetores, e 
portanto mudaria a distância da origem até o vetor. E 


Definição 8.11 (rotação própria e imprópria). As isometrias com determinante +1 são rotações próprias; as 
que tem determinante —1 são rotações impróprias. + 


As rotações impróprias são claramente aquelas que mudam a orientação de um conjunto de vetores. 


Exemplo 8.12. O operador que troca as coordenadas de ambos os eixos, levanto (x,y)! em (y, x)", tema 


matriz 
10 


—s 


Este operador é uma isometria central, e uma rotação imprópria; a matriz tem determinante —1. 
Claramente este operador muda a orientação de uma base, já que ele é exatamente a matriz de permu- 
tação de colunas. < 


Exemplo 8.13. O operador que reflete no eixo y é 
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Este operador é uma rotação imprópria, e seu determinante é —1. < 


Exemplo 8.14. No exemplo 8.4|mencionamos que o operador que muda o sinal de uma função em C[0, 1] 
é uma isometria central. Este operador é uma rotação imprópria. < 


Exemplo 8.15. O operador 
é ortogonal: sejam 


Então 
(v, w) = viw +v2w2. 


1 1 
OREN 
amam = AR (al 

(5 Y) = (227) 
V2 vz + vi)! V2 wa + wi 
(v2 —vi)lwz — w1) d (vz +vı)(w2 + wi) 
2 i 2 
= V1ıWı + v2w2. < 
(o) exercício[240|pede a demonstração da proposição|8.16] 


Proposição 8.16. Se A é um operador ortogonal em R2, então A realiza (i) uma rotação, ou (ii) uma reflexão por 
alguma reta passando pela origem. 


Mas 


Definição 8.17. Uma matriz ortogonal é toda matriz quadrada cujas colunas formam um conjunto ortonor- 
mal. + 


Exemplo 8.18. A base canônica para R” é uma matriz ortogonal, já que seus vetores são todos ortogonais 
entre si, e cada um deles tem norma igual a um. < 


z0 ') 
v5 U =2 
I(2/v5,1/v5)" = 1 


I0/v5,-2/v5)"=1 
(12/45, 1/5)", 1/v5,-2/v5)"} =0. à 


Exemplo 8.19. A matriz 


é ortogonal, porque 


Teorema 8.20. Uma matriz real A é ortogonal se e somente se A tem inversae A! = A™!. Ou, equivalentemente, 
ATA =71. 
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Demonstração. (=>) As colunas de A são as linhas de AT: 


(a!)” 
2)T 
E A! = tao) 
(an)7 
Calculamos 
al)T 
2)T 
ATA = i (a!,a?, a) 
art 
a')Ta! (al)Ta? (a!)Tar (a!;a!) (ala) (a!,an) 
: a2)Ta! (a2)Ta2 (a2)Tam E (a2,a!) (22,32) (a2,a") 
ar Tal (a")Ta?2 (a™) Ta" (at a!) (a™, a?) (a”,a”) 


Mas como colunas diferentes são ortogonais, então (at, a} = O quando i 4 j. Por outro lado, como as 


colunas são ortonormais, sabemos que a no 
claro que 


rma de cada uma delas é um, portanto (at, at} = 1, e fica então 


So 


00 1 


(&)sSe AT = AT! então AA! = Z. Seguindo o mesmo raciocínio usado anteriormente nesta demonstra- 


ção, verificamos que os produtos internos ( 
i=j. 


Corolário 8.21. Se A é ortogonal, det A = 4 


Demonstração. Se AT = AT!, então 


Interpretamos este corolário: as matriz 
vol AX. 


Exemplo 8.22. A matriz 


é ortogonal, porque suas colunas formam um conjunto ortogonal, e seu determinante é +1. 


at, a) devem necessariamente zero quando i Æ j, e um quando 


E 
E] 
det A! = det A7! 
det A = det A7! 
det A = (det A) | 
det A = 1. E 


es ortogonais preservam volume: se A é ortogonal, então vol X = 


2 — 
2 


2 


2 
— 
2 
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A recíproca do coroário|8.21|não é verdadeira, como mostra o exemplo 


E) 


tem determinante +1, mas suas colunas não são ortogonais. < 


Exemplo 8.23. A matriz 


Teorema 8.24. Um operador é uma isometria se e somente se sua matriz é ortogonal. 


Demonstração. Matrizes ortogonais preservam volume; o volume de um vetor é sua norma. Assim, matrizes 
ortogonais preservam norma. Consequentemente, preservam produto interno, e representam isometrias. 
E 


Teorema 8.25. Se A e B são ortogonais, então AB é ortogonal. 


Demonstração. A intuição nos diz que a composição de duas transformações que preservam distâncias tam- 
bém preservará distâncias. Apresentamos também uma demosntração algébrica a seguir. 
Temos ATA =Z e B! B =Z, logo 


(AB)'AB = (B'A! )AB 
= B! (AT A)B 
=B'B 
= fe m 


O teoremaļ8.26|dá uma caracterização alternativa de transformações ortogonais. Sua demonstração é 


pedida no exercício 


Teorema 8.26. Uma transformação é ortogonal se e somente se leva bases ortonormais em bases ortonormais. 


Teorema 8.27. Os autovalores reais possíveis de uma matriz ortogonal são +1. 


Demonstração. Intuitivamente, se um operador ortogonal A preserva norma de vetores e temos Av = Av, 
necessariamente |A| deve ser um - de outra forma estaríamos mudando a norma do vetor. A demonstração 
algébrica segue. 

Seja A uma matriz ortogonal com autovetor v e autovalor À €. Então 


0 Il? (autovetor não é zero) 
= Av 
= (Av, Av) 
= (Av, Av) 
= Mp. 


Como ||v|| = A?||v||, necessariamente A? = 1, e como À € R, temos À = +1. E 


O Teoremaf8.27| no entanto nada diz sobre autovalores complexos. 
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Exemplo 8.28. A matriz 


—1/2 0 1/2 
01 0 
= 0 =i 


é ortogonal (suas colunas formam um conjunto ortogonal), e tem autovalores 


iv7+3 iv7-3 


ba. à 


O único autovalor real da matriz é 1. < 


Sabemos que um dentre +1 e —1 é autovalor real de A. O teorema a seguir nos permite identificar, 
quando A tem ordem ímpar, um deles como autovalor da matriz. 


Teorema 8.29. Se A é quadrada, ortogonal e de ordem ímpar, então det A é autovalor de A. 
Demonstração. Suponha que det A = +1. O poliômio característico de A é 


p(x) = —x™ +... + det A 
= —x"” +... +1 


Assim, p(0) = 1, positivo. Quando x — +oo, temos também p(x) — —oo. 
raiz: p(x) = 0 


(0,1) 


p(x) => —oo 


Pelo teorema do valor intermediário, p(x) deve valer zero para algum x no intervalo (0, oo). Como sabemos 
que os autovalores reais de A só podem ser +1, temos que 1 é autovalor de A. 
Seo det A = —1, repetimos o argumento usando (—oo, 0) ao invés de (0, +00). E 


Exemplo 8.30. A matriz do Exemplo tem dimensão ímpar, e seu determinante, +1, também é um de 
seus autovalores. < 


Teorema 8.31 (de Euler). Se uma matriz M ortogonal de ordem tres tem determinante +1, então M tem um 
autovetor fixo, correspondente a um eixo de rotação. O ângulo de rotação é 


TrM 
2 


cos O = 
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Exemplo 8.32. A matriz de rotação pelo ângulo O = 371/4 é 


cos(37/4) —sen(37/4) O —v2/2 2/2 0 
R= | sen(37/4) cos(3n/4) 0] =| v2/2 —v2/2 0 
0 01 0 01 


R é ortogonal, e seu determinante é +1. O traço desta matriz é 
TrR=2cos(3n/4)+1=1-—v2. 


O ângulo 0 é, então 


TrM-—1 
2 
_ Zcos(3n/4)+1-—1 
f 2 
= cos(37/4), 


cos O = 


Os autovalores e autovetores de R são 


^ =—v2+iv2, (1) 
0 
A2 =-v2-iv2, A 
0 


A3 


II 
TAN 
= SO 
ko oi 


O único par autovalor /autovetor real é o terceiro, e o autovetor nos dáexatamente o eixo de rotação (z). « 


No exemplo a matriz de rotação já deixava evidente o eixo em que a rotação acontece (z). O 
exemplo|8.33Jusa a composição de duas rotações em eixos diferentes. 


Exemplo 8.33. A matriz Ra a seguir faz rotação de 377/4 pelo eixo z; a matriz Rg faz uma rotação de 7/4 
no eixo y. 


cos(37/4) —sen(37/4) O cos(7/2) O —sen(7/2) 
Ra = |sen(37/4) cos(3m/4) 0)» As = 01 0 
0 01 sen(77/2) O — cos(7/2) 
Numericamente, 
O 1 g + o) gal (: 0 E) 
AaA=-5\ 1 vo) M= 5101 0 
v2 0 01 v2 10 1 


A composição das duas é 
fina 1/2 
RaRB= | 1/2 —1/v2 —1/2 
1N2 0 1/42 
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Se olharmos somente para a matriz Ra Rg, não temos como determinar facilmente o eixo de rotação. No 
entanto, podemos verificar que os autovalores de Ra Rg são 


7-3 W7+3 


i 
L—7 ` 


O autovetor correspondente ao autovalor 1 é 


1 
1+v2 
Como os autovetores gerados por este vetor são os únicos que a transformação não rotaciona (porque 
Ra Rgv = v), eles formam o eixo de rotação da transformação. Já o ângulo é 8, com 


TrM-—1 
Bs TO 
cos 3 
p= 
= 2 
= —3/4. 
O ângulo O é aproximadamente 0.777 = 2.42 radianos, ou 138.6°. < 


8.1.1 Decomposição QR 


Nesta seção verificamos como uma matriz pode ser decomposta em produto de uma matriz ortogonal por 
uma matriz triangular. 


Teorema 8.34. Seja A uma matriz quadrada. Então existem uma matriz Q ortogonal e uma matriz R triangular 
superior e não singular tais que 
A=QR. 


A demonstração deste teorema é construtiva, e nos dá um algoritmo para computar a decomposição 


QR. 


Demonstração. Se aplicarmos o processo de Gram-Schmidt, descrito na seção[7.4] nas colunas a1,a2,... de 
A par obter colunas 01,02,..., ortogonais, teremos 


01 = à 
o (01,42) 
02 = ay — 01 
(01,01) 
02,a 07,a 
gs (02, al o (01, 3) o 
(02,02) (01,01) 
x (0;,ax) 
Ok = ax — i) 
(0i, 04) 
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e temos o conjunto ortogonal 01,...0x. Normalizamos os vetores, para que todos tenham norma um, 
definindo q; = 01/1]o; ||, e já temos amatriz Q: 


1 
(a q qn) = (To TS Tot) 


Agora observamos que 


a, = 01 
01,a 
Ep b 2 
(01,01) 
ayo (02 ph (01,23) 
(02,02) (01,01) 
ak = ok + (Oak), 
1 
fe O 0%) 
Definimos a matriz R com 
0 sei>j) 
Tij = lo; sei = j 
lo; na) sei <j 
Temos portanto 
lol} o1 || loillinen z lonllforos) 
0 oz] llo211 4222% loal fse 
A=(m q a)|o 0 losl losile |, 
b a 4 —— . . A . 
Q : : o : 
Ao o E lonl 
R 
e a k-ésima coluna de A é 
(oi ak) 
ak = quilo +2 2 qilloill 
01,01) | 
(o; ax 
=o +) — i; (oi = q:/Ilo:) 
i<k (0i, 01) 
completando a demonstração. E 


Exemplo 8.35. Seja 


a-f O 
PR pa 


a ortogonalização das colunas de A nos dará os vetores 


EEE 
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Normalizamos os vetores. As normas são |01|| = v5 e |o2| = 1/5, logo 
o ( a 
qı so , q2 -V5/5 


(1/75 245/5 
di Es e) 


A matriz Q está pronta: 


A matriz R é 


g = (loill loi {ge =p o 
0 [A 0 1/v5 


Temos Q evidentemente ortogonal, R triangular superior e invertível, e 


A = OR. < 


8.2 Operadores normais 


Definição 8.36. Um operador real é normal se comuta com sua transposta + 


8.3 Decomposição em Valores Singulares 
Teorema 8.37. Seja M uma matriz real ou complexa. Então existem duas matrizes U e V unitárias (ortogonais, se 


M é real); e uma matriz X diagonal, tais que 
M = UZV", 


Exemplo 8.38. Seja 


nei, 242) 


A decomposição de M em valores singulares é 
M-L ( pi (2 a pura va) | 
2%] 4/10 A 0 1 
jie TOE A O, A, 
ù Z vT 

As matrizes U e V são ortogonais, e £ é singular. Os valores singulares de M são 2 e —1. « 
8.4 Aplicações 
8.4.1 Análise de Componentes Principais 


Exercícios 


Ex. 240 — Demonstre a proposição 
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Ex. 241 — Há uma classe de matrizes tais que ATA = D, com D diagonal. Que matrizes são estas? 


Ex. 242 — O conjunto de matrizes descrito no exercício é fechado para multiplicação de matrizes? E 
nesse conjunto, a multiplicação é comutativa? 


Ex. 243 — Quais são as isometrias que podemos ter em Mn x n, usando o produto de Frobenius? 


Ex. 244 — Quais são as isometrias que podemos ter em Mn x n, usando o produto (A, B) = maior auto- 
valor de ATB? 


Ex. 245 — Prove o Teoremaf8.26] 

Ex. 246 — O produto de matrizes ortogonais é comutativo? 

Ex. 247 — Quais destes conjuntos são grupos com a operação de multiplicação de matrizes? 
a) Matrizes ortogonais 


b) Matrizes ortogonais com determinante +1 


c) Matrizes ortogonais com determinante —1 


Ex. 248 — Calcule a decomposição QR de 


Capítulo 9 


Pseudoinversa 


Sabemos que nem toda matriz quadrada tem inversa. Neste Capítulo estudamos uma generalização da 
noção de inversão de matrizes: toda matriz tem uma pseudoinversa, mesmo que seja singular ou que não 
seja quadrada. 

Assim como fizemos com o determinante, definiremos a pseudoinversa por suas propriedades, e de- 
pois demonstraremos que é única. A prova de existência da pseudoinversa, no entanto, envolve conceitos 
adicionais que ficam fora do escopo deste texto. 


Definição 9.1 (Pseudoinversa de matriz real). A pseudoinversa de Moore-Penrosd! |de uma matriz real À é 
a matriz A* tal que 


i) AAfA=A 
ii) AtAAt = At 
iii) (AAt)! = AAt 
iv) (AtA) = AtA + 


Da definição fica claro que se uma matriz é não-singular, sua inversa é igual à pseudoinversa. 

Observe que mesmo matrizes que não são quadradas tem pseudoinversa, como ilustrado na última 
matriz do exemplo[9.2] Matrizes singulares também (mesmo a matriz zero tem ela mesmo como pseudoin- 
versa). 


Exemplo 9.2. As pseudoinversas das matrizes 


são 
100 a 2 05 50 
A*=|90 0) B= 7]: *=|o Sé), Dt=| 2o a 
25 25 1 1/1 
0 0 1 275 25 idd E 


!Há outras noções de pseudoinversa, de que não tratamos aqui. 
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(0) teoremaļ9.3]nos garante que toda matriz tem uma pseudoinversa. 
Teorema 9.3. Toda matriz real A tem pseudoinversa. 
Demonstração. A matriz A, m x n, pode ser decomposta em valores singulares: 
A= Uninen Vs 
onde 
* Um é ortogonal, de ordem m 
e mxn ém x n, diagonal na sua parte superior, 
* Vn é ortognal, de ordem n. 
Então a pseudoinversa de À é a matriz n x m 
At = VIU]. 
Verificamos as propriedades de pseudoinversa a seguir. 
i) 
AA*A = (UZV! (VZ tu! (UZV 


= u(zv'vEtuluz)v” 

= UZT +I V! (U, V ortogonais: U! = UT!, VT = V-1) 
= U(LL*2)VT 

=UV! (pseudoinversa de Ł, prop. (i)) 
=A. 


ii) Similar a (i) 
iii) 


k 
(AA+)T = [avz+u™] 


E 
= [uzv ve tum] 
= (vetuO' (uzv!)" 
= UZVI V(Z*) U! 
= UZ'Za (2+) "UT (V é ortogonal: V! = V-1) 
= AAt 

iv) Similar a (iii) E 


A decomposição em valores singulares não é única, mas mostramos a seguir que há exatamente uma 
pseudoinversa para cada matriz. 


Teorema 9.4. Toda matriz real A tem no máximo uma pseudoinversa. 


Demonstração. Seja A uma matriz real, e sejam B e C pseudoinversas de A. Usamos abaixo álgebra básica 


de matrizes e suas transpostas, além das propriedades listadas na definição de pseudoinversa para mostrar 
que AB = AC. 


AB =(AB)" (propriedade (iii)) 

=BIAT 

=B! (ACA)! (propriedade (i)) 

=B'A1C! AT 

=(AB)!(AC)' 

=ABAC (propriedade (iii)) 

=AC (propriedade (i)) 
Mostramos que AB = AC. Pode-se, de forma semelhante, mostrar que BA = CA, E 


Lema 9.5. A pseudoinversa de um vetor coluna v é o vetor linha v™, com 


1 
vt = {me sev #0 
0 sev = 0. 


Da mesma forma se define a pseudoinversa de um vetor linha (seráum vetor coluna, obedecendo a mesma regra, exceto 
que para colunas ||v||? = v" v, e para linhas, ||w||? = ww”). 
A pseudoinversa de uma matriz quadrada diagonal D é outra matriz diagonal E, com 


ei = NO se dii #0 
0 se dii = 0. 


Exemplo 9.6. Sejam 


1 1 00 O 
A B=|—3 p-|0 20 0 
(2 0 1/2 1), BAE o ooi 
0 O 00 2/5 
Como 
lo 4 
AAL) 21 
1 
EB — 
Então as pseudoinversas são 
r i 8 j 1 00 O 
Ro U RO, iq +_ |0 -12 0 0 
weI ao N a a eE O O < 
4 0 0 0 5/2 
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A demonstração to teoremal9.7]é pedida no exercício[251] 
Teorema 9.7. Seja A uma matriz real. Então 
i) (ATT =A. 
ii) Se A tem inversa, então At = ATT, 


ii) (AD* = (AMT, 


iv) (kA)* = KT A+, para k £ 0, 


Teorema 9.8. Para toda matriz A, ker(A*) = ker(AT),eIm(A*) = Im(A”). 


9.1 Calculando pseudoinversas 


Há diversos métodos para obter a pseudoinversa de uma matriz. Damos inicialmente dois métodos sim- 

ples (o de decomposição em posto e o método por blocos); e dois outros de robustez numérica razoável, 

normalmente usados em aplicações práticas. 

9.1.1 Decomposição em posto completo 

Seja A uma matriz m x n com posto r. O Lemal[4.43]nos garante que A pode ser decomposta em 
A=BC, 

com B m x re Cr x n, sendor o posto tanto de B como de C. 


Exemplo 9.9. Seja 


A matriz tem posto 2, então 

1 2 

A-|3 6 104. « 

3 à (1 1 

01 
Teorema 9.10. Seja A matriz real A m x n com posto r, e A = BC sua decomposição em posto completo com B 
m x r, Cr x n, ambas de posto completo igual a r. Então 

A* Sel CC "(Bras 


Exemplo 9.11. A matriz 


cs (25 n 
o o 
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evidentemente não tem inversa, porque tem uma linha com zeros. Seu posto é um, e sua decomposição em 
posto completo é 


A = (1) (2/5 4/5) 


Logo, 
AT = eee! (B'B)|! BT 


sda 2/5000 1\ J7! 
= (25) [tes 4/5) (IN la o (1)] (10) 
= 
= aa (5) 070 0) 
_ ( /2 ) 
10 
Verificamos facilmente as quatro propriedades que definem pseudoinversa: 
AAtA = a 15) e e) (25 o) 2 a an) 
0 O 1 0 NY o 0 0 
Waira A. o) o o) (172 o 5 E É 
10 o o 10 1 0 


(AAS I S 2) r (simétrica) 
AtA)= [1 o). simétrica 
(A+A) 4 0 ) 
«4 
Exemplo 9.12. Seja 
B 
Fa c 
1 2 
PRA o ( o). 
32 01 
01 


Então, como C = Z e B = A, 


AT = E ec (B!B)! BT 
=T' (IIT) (ATA) TA! 
Es (ATA)T!AT 


= 

- [A 45 a ( 33 o) 
179 |-26 19 Tod À 
1 


ON 7a E 
179 Ã12 36 —40 19 
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Verificamos que AATA = A: 


12 12 17 5 3 dio 
26 (55 A Ra 1 |51 153 9 36)[36 
3 2] 179 \12 36 —40 19/ (3 2] 17713 9 169 —40] {32 
01 01 2 36 -40 19/ \0 1 
12 
[3 6l. á 
3 2 
01 


Exemplo 9.13. Abordamos agora um caso em que a matriz A é m x n, e o posto é estritamente menor, 
tanto do que m como do que n. Seja 
1 05 
A= |y 1 0 
1-15 


O posto é dois, porque L3 = L1 — L2. Disso concluímos que 


Assim, 


11/13 1/26 1/26 
EE: 1 2 —1 |. < 
5/13 5/26 5/26 


9.1.2 Por blocos 


Se A pode ser decomposta em 


Ña (au e) 
Az A22 


onde A11 é quadrada e tem o mesmo posto de A, então 


E 
ToT/AÃ 
A+ = (Ay A12) B fab , 


B = [an Ay) A! (a) . 


A21 


com 
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Exemplo 9.14. A matriz 


com Ai; = (aij), ou seja, 


. Temos 


AT 
que é a pseudoinversa de A. 
Exemplo 9.15. Seja 
pe: p 
Então 
AL |1 2\ Ay- ( 4 
11 E T 12 e: 
Como o posto A = posto A11 = 2, calculamos 


-N 


21 
—11 


2 4 
3 —4 


—1] 
26 


A= 


a 


é singular, com posto um. Podemos identificar os blocos 


A= (210) 
—2 | 0a’ 


= [2 —1 
- (2) 192 2) 
— (4 Pe) 

0 , 


0 


—21/2 
11/2 


y —1 
o 
4 —4 


] 


“A 


i7% 
a 3 
DA] 


il 
] 
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-3( 149/2 D 
2 (159/2 101 


e (202 E, 
10625 (159 149 


T] J 1 2 
-( 12 3) (202 78) oN 3 
-1 3 -4) T0625 Uso 149) | dp 

1 (12/85 —2/17 —6/85 


=| 45 1o 2/5). a 
48/85 —8/17 —24/85 


9.1.3 Método de Greville 


O método recursivo de Greville calcula a pseudoinversa de uma matriz particionando-a e computando as 
pseudoinversas de matrizes menores. Ë interessante por ser rápido e não depender de informações adici- 
onais sobre a matriz, como autovalores. 


Teorema 9.16. Se A ém x n, e asua última coluna, ou seja, 
A= (5 a) ; 


At (E-a) ; 


X 


então 


onde 
T (Ez BB*Jal|-2(Z — BB*Ja selI(Z — BB*Jall £ 0 
(1-+I|Btal2)-!(B*)'Bta caso contrário. 


a=( D-2 3) 
eg —s4 —2 


Calculamos a pseudoinversa de A usando o método de Greville. Temos 


— r 1 2 = [— 
sosia (3 3) (a) 


Exemplo 9.17. Seja 


Assim, 
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Obtemos a pseudoinversa de B. Usaríamos o método de Greville para isto, mas para não tornar o exemplo 
demasiado longo e conceitualmente difícil, apresentamos de imediato a matriz 


1 
Br === 1 —2 . 
a z) 


Agora, calculamos a norma de (Z — BB* J)a: 


I(T — BB+ )all = (7-5 ba a) E 


1 
pal 
4 
5 
Assim, 
x! =||(Z — BB* Jall? (T — BB” Ja 
-531/8 
-16 5 (4 
-If 
DD 
E temos 


Mal fr 2 1/2 VA (1/10 so 
EC ET É z z( 1 = fã —1/10/ ’ 


1/10 —1/20 
|) 1/5 =1/10 
MO 1/4 


e finalmente 


Verificamos uma das condições: 
» (MO 1/20 à cn 

AATA = o — o 
q E 1/5 —1/10 (a = 3) 


| 
E —1/2 —1/4 
( 12 E 
o 
A. 


4 


x 9.1.4 Método iterativo de Ben-Israel e Cohen usando maior autovalor 


Há um método iterativo para aproximar a matriz pseudoinversa de uma matriz dada. 
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Teorema 9.18. Seja À o maior autovalor de AA! (que é quadrada). Para qualquer b tal que O < bA < 2, e 


qualquer p > 2, defina a sequência de matrizes Bo, B1, . . . definida recursivamente a seguir: 
Bo = bA! 
T. =Z — BA 
p—1 


Bk+1 = Bk + by TBk 


im 
Quando p — œ, Bk — A”, 


Exemplo 9.19. Calcularemos a pseudoinversa de 


Temos 


YW1 o o 
AA = 0 1-1), 
0 —1 1 


com autovalores 0, 1 e 2. Como o maior autovalor é À = 2, escolhemos b = 1/2, de forma que bà = 1. 
Na primeira iteraçãom temos 


Bo =x 5A’ 
To =Z— BoA 
Ou seja, 
Bo = (172 0 7 To = (1/2 DE 
0 —1/2 1/2 0o 0 
Na segunda iteração temos 
Bı = Bo 
Tr =7-—B A 
Bı =Bo, h= Ni o) 
0 0 


Na terceira iteração, 


B2 = B} + (TÊBo + T1B1) = Bi + Bo + Tı Bı 
Tbt =7-—BA 


B= E 0 ) ie (1/3 É) l 
0 —1/2 1/2 o 0 
As próximas iterações nos darão 


Ba — (0.984375 0 0 Ba = (0.9999999 0 
0 —1/2 1/2)’ 0 1/2 1/2)’ 
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e B; claramente converge para 


É 0 ) 
0 —1/2 1/2)’ 


que é a pseudoinversa de A. « 


9.1.5 Usando autovalores 


Se conhecemos todos os autovalores de uma matriz, o Teorema nos dá uma forma fechada para a 
pseudoinversa. 


Teorema 9.20. Sejam A; os autovalores de AA” (que é quadrada). Então a pseudoinversa de A pode ser calculada 
pela fórmula 


at=) + L[w- aT ITA -7 


Ago! \(jži jzi 


Exemplo 9.21. Seja 
RA (172 ad 
| <i 


ant (112 J 
h 2 


Temos 


com autovalores 0 e 5/2. Logo, 


Calculamos 


cujos autovalores são 0, 1 e 2. A pseudoinversa de A é 


At =- ((1—0)7'(1 — 2)7') AT ((AAT — 0T) (AA! — 27)) 


=| = 
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+ ((2-0)"(2-1)-D A! ((AA! — 0T) (AA! — 17)) 
=(1)(—~1)A"(AA" — 27) 
+(1/2)(0A! (AA! — 7) 


1 
=— A! (AA! — 27) + JAT (AA! — T) 


efe "DO 
EO 


A fórmula apresentada nesta seção é obtida do teorema da regularização de Tikhonov, que determina 
que A* = lim, so AT(AA! + x7)"!, que não detalhamos neste texto. 


9.2 Matrizes complexas 


Pseudoinversas são definidas para matrizes complexas da maneira usual: a definição para matrizes reais é 
adaptada, tricando “transposta” por “conjugada transposta”. 


Definição 9.23 (Pseudoinversa de matriz complexa). Seja A uma matriz complexa. A pseudoinversa de A 
é At tal que 


i) AAfA=A 
ii) AtAAt = At 
iii) (AAt)Ħ = AAT 
iv) (AtAJH = AtA + 


Exemplo 9.24. A matriz 


tem pseudoinversa 


Todos os teoremas e métodos deste capítulo valem quando se troca A! por A". 


9.3 Aplicações 

9.3.1 Sistemas lineares 

Tratamos agora de sistemas lineares descritos na forma 
Ax=b. 


Quando A é singular ou não é quadrada, podemos ter um sistema indeterminado ou um sistema incompa- 
tível. Nestas situações, podemos tentar escolher a “melhor” dentre as possíveis alternativas. 
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* Seo sistema é indeterminado, temos infinitas soluções. Queremos aquela com a menor norma pos- 
sível. 


* Seo sistema é incompatível, não há solução. Queremos então encontrar o vetor para o qual a distân- 
cia d(Ax, b) é a menor possível. 


Quando A é quadrada e det A Æ 0, uma das maneiras de determinar a solução para um sistema linear é 
computar x = AT !b. O teorema a seguir nos garante, no entanto, que mesmo quando A é singular ou nao 
é quadrada, se usarmos a pseudoinversa ao invés da inversa obteremos uma solução com a menor distância 
possível de b. 


Teorema 9.25. Seja A uma matriz realm x neb € R™. Então 
Ax — bll? = ||Ax— AAbIP + ||(Zm — AA IP. 
Demonstração. Usando a definição de pseudoinversa (AA TA = A), temos 


Ax —b =(Ax — AA +b) — (Im — AAT )b 
=AAM(Ax—b) = (Im — AA+ )b. 
Para demonstrar o teorema, observamos que a igualdade enunciada assemelha-se ao Teorema de Pitágo- 


ras para vetores ortogonais. Assim, ela deve valer se e somente se Ax — AA tb e (Zm — AA+ )b forem 
ortogonais. Calculamos o produto interno 


(AA* (Ax —b, (Zm — AA+ )b) = (Ax — b, (AA?) (Zm — AA” )b) 
(Ax — b, (AA*)(Zm — AA+ )b) 
= {Ax — b, 0) = 0; 


e concluimos a demonstração. E 


Olhando novamente para a igualdade no teoremaf9.25] observamos que no lado direito, apenas o pri- 
meiro termo, |Ax— AA b||}, depende da escolha de x. Queremos portanto minimizá-lo a fim de minimizar 
o lado esquerdo, ||Ax — b||?. Para minimizar ||Ax — AA+bI|? podemos evidentemente escolher x tal que 
Ax = AA*b, ou seja, 

x= Ab. 


Desta discussão concluímos que: 
* Se A é quadrada e não-singular, então A*b = A-!b, e ambas nos darão a mesma solução única; 


e Se o sistema é incompatível, A*b nos dá a solução que mais se aproxima do que poderia ser uma 
solução ótima; 


* Seosistema é indeterminado, A*b nos dará, dentre as infinitas soluções, uma que minimiza a norma. 


Exemplo 9.26. Seja Ax = b um sistema linear com 


a (309, »=(5 
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O sistema é indeterminado. A pseudoinversa de A é 


A norma de x é V107/6 = 17.83. « 


Exemplo 9.27. Seja Ax = b um sistema linear com 


E a solução £ tal que AR mais se aproxima de b é 


g=Atb= E : 
0 


Para completar o exemplo, AR = (—2, 2)", com norma 2,2 = 2.83. A norma de b é v10 = 3.16. < 


Exercícios 


Ex. 249 — Calclue as pseudoinversas das matrizes a seguir. 


a=(] Al b= 2), c 
NG 0 0 


Ex. 250 — (Fácil) Prove quese A é m x n, então At én x m. 


Il 
r 
NO 
GM 
now 
a 


Ex. 251 — Prove o teoremal9.7] 


Ex. 252 — Se (AA!) é não-singular, determine uma fórmula simples para a pseudoinversa de A. 


D I 2 1 
Gla — Rir 


i) Calcule a pseudoinversa de A usando o método da decomposição em posto completo. 


Ex. 253 — Seja 
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ii) Calcule a decomposição de A em valores singulares, e use esta decomposição para calcular A7. 

iii) Calcule A+ usando o método dos autovalores, e verifique que o resultado é o mesmo obtido no item 
(i). 

iv) Calcule algumas iterações do método iterativo de Ben-Israel e Cohen; verifique que a sequência con- 
verge para a matriz obtida no item (i). 


Ex. 254 — Considere todos os sistemas incompatíveis Ax = b onde os coeficientes de A estão no intervalo 
[—1, +1]. Existe um valor máximo para a distância mínima entre as aproximações AT eb? 


Ex. 255 — Considere o sistema Ax = b, com 


a= bey += (3) 


Encontre a solução x que minimize a distância d(Ax, b). 


Ex. 256 — Prove que para qualquer matriz complexa A, 
(KAJH = kA" 
‘Se A é quadrada, det A* = det A 
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Capítulo 10 


Forma de Jordan 


No Capítulo[6jmencionamos que uma matriz de ordem é diagonalizável se e somente se tem n autovalores 
LI (teoremal6.55), mas nada dissemos a respeito das matrizes que não são diagonalizáveis. Neste Capítulo 
verificamos que todo operador é similar a uma matriz em uma forma “quase” diagonal, chamada de forma 
de Jordarf] A forma de Jordan de um operador é diagonal em blocos, 


ADIA. 


e cada bloco J; tem uma mesma entrada (possivelmente nnula) em toda a diagonal, e uns acima dela, sendo 
todas as outras entradas iguais a zero: 


Embora não detalhemos este fato no texto, somente garantimos a existência da forma normal de Jordan 
para espaços vetoriais sobre corpos que sejam algebricamente fechados (ou seja, todo polinômio não cons- 
tante neste corpo tem alguma raiz neste mesmo corpo - o que não acontece com reais, por exemplo: o 
polinômio x? + 1 tem raízes complexas, mas não reais). Ao desenvolvermos a forma de Jordan, portanto, 
falaremos em operadores em C”, já que C é algebricamente fechado. 


Definimos agora formalmente a forma de Jordan. 


Definição 10.1 (bloco de Jordan). Um bloco de Jordan é uma matriz quadrada onde todos os elementos da 
diagonal são iguais a um mesmo elemento À; elementos acima da diagonal são todos iguais a um; e todos 


Também chamada de forma normal de Jordan, ou forma canônica de Jordan. 
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os outros elementos da matriz são zero. 


A10.. 0 
0 1 0 
00 Aà : + 
: =. 7 
o o A 


Pode-se alternativamente definir blocos de Jordan tendo uns abaixo da diagonal, e não acima. 


Exemplo 10.2. Todas as matrizes a seguir são blocos de Jordan. 


2100000 

à 0210000 

11 0 Lir Tor 0021000 
0 —1 1 e a 0002100 < 

0031 0011 

0 0 El S003 E O 0000210 

0000021 

0000002 


Definição 10.3 (forma de Jordan). A matriz de um operador linear T está na forma de Jordan se é diagonal 
por blocos, e os blocos da diagonal são blocos de Jordan, cada um tendo um autovalor de T em sua diagonal 
- ou seja, 


Bı 0... O 
dé). B) | AO l, 
S a Be 
onde cada B; é um bloco de Jordan. + 


Exemplo 10.4. O operador representado pela matriz abaixo não é diagonalizável, porque tem somente o 
autovalor —1, com um único autovetor LI. 

>2 1 

—1 0 


A forma de Jordan deste operador é 


i 
QDO O 


1 
IN E E E, 
1 1 


Note que a matriz D tem tres blocos de Jordan: um de ordem 3 com À = 3 na diagonal; outro de ordem 2, 
também com À,» = 3 na diagonal; e um de ordem 2 com à; = 5 na diagonal. < 
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O Exercício|258]pede a demonstração do Lema 


Lema 10.6. Se N é uma matriz nilpotente tal que N* = 0, então 


N2 N3 nk! 
N 
ELS E O E 
i PATTE rk- 
keti 
E; ET 
i=0 


Lema 10.7. Seja D uma matriz diagonal e N uma matriz nilpotente tais que DN = ND. Então 


D+N — eD eN, 


Teorema 10.8. Seja J uma matriz na forma de Jordan, composta por blocos de Jordan J1, J2, . . ., Jy. Então 


onde D é a matriz diagonal com os autovalores de J,e N é J — D, contendo apenas os uns na diagonal. 


Demonstração. A forma de Jordan é sempre a soma de uma matriz diaonal com uma nilpotente, e o Lema 
dá a forma da exponencial. E 


10.1 Existência e cálculo da forma de Jordan 


Nesta seção mostramos a existência da forma de Jordan. Como a demonstração é construtiva, dela 
podemos extrair também um algoritmo para a construção da forma de Jordan de qualquer matriz quadrada. 


10.1.1 Subespaços invariantes 


Definição 10.9 (subespaço invariante para um operador). Seja W um subespaço de um espaço vetorial V. 
Dizemos W é invariante sob W se para todo vetor w € W, o operador resulta em outro vetor também em 
W - ou seja, Tw € W. 4, 


Exemplo 10.10. Em R?, considere o subespaço W contendo os vetores (x, 2x)". Este subespaço é com- 
posto pelos pontos da reta y = 2x. O operador T(x,y) = (4x, 8y). O subespaço W é invariabte sob T, 
porque leva os pontos daquela reta a outros pontos também nela. 

O subespaço W já não é invariante para o operador S(x,y) = (1,y), porque S(2,4)" = (1,4)!,e 
(LAT g W. « 


Um fato evidente é que o subespaço trivial é invariante para qualquer operador linear. 


Exemplo 10.11. Em R3, considere o subespaço W contendo os vetores (x, 2x, z)". Este subespaço é com- 
posto pelos pontos de um plano. Este subespaço é invariante para o operador T (x,y,z) = (x/2,U/2, 102), 
mas não para o operador S(x,y, z) = (z,;y,x)!. < 


Exemplo 10.12. Sabemos que o espaço das funções contínuas e diferenciáveis (definido no exemplo[1.54) 
é subespaço de F(R). Este subespaço é invariante sob o operador T(f) = 2f, porque se f é contínua, 2f(x) 
também é. < 
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Teorema 10.13. Seja V um espaço vetorial igual à soma direta de dois subespaços U, W: V = UG W. Se Bu e 
Bw são bases para U e W, então B = Bu U Bw é base para V. 


Teorema 10.14. Seja V um espaço vetorial igual à soma direta de dois subespaços U, W: V = UG W. Se Bu e 
Bw são bases para U e W. Em forma matricial, as bases Bu e Bw concatenadas formam a matriz 


B= (Bu Bw)- 
Seja T um operador em V, expresso na base B na forma matricial: 
t= E 1h 2) f 
Ta Ra 
Se T12 = 0 então W é invariante para T. 


Se T21 = O então U é invariante pra T. 


Este teorema pode ser generalizado para a soma direta de vários subespaços (não apenas dois). 


10.1.2 Autovetores generalizados 


Se T é diagonalizável, então V é a soma direta dos autoespaços de T. 


Então 
N; (A) a No(A) ed Nn(A). 


Seja T um operador com n autovalores e n autovetores diferentes, v1, . . ., Vn. Os autoespaços são 
ker(T — AZ), i=1,...,n. 
Cada autoespaço é invariante para T, porque se 
(T-AiZ)v=0 


então, para Tv, temos 
(T-AT)Tv=T(T-AZ)v=0. 


Definição 10.15 (autovetor generalizado). Seja T um operador linear. Um vetor v é um autovetor generali- 
zado se existem um escalar À e um inteiro positivo p tais que 


(T—-AZ)Pv=0, e 
(T-AT)P- Ivo. 


Dizemos que v tem ordem p. + 
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Observe que se p = 1, o autovetor generalizado é o mesmo que um autovetor, como definido no capí- 


tulof6] 
122 
f=,02.2 
001 


Exemplo 10.16. Seja 
um operador linear. Os autovalores de T são 1 e 2. Para o autovalor 1, o vetor 


é um autovetor generalizado de ordem 2, porque 


T- (o A a 2) =o 

000/41 
0272 3 2 

=w= (o 1 )( 2)= (6) < 
0 0 0/ AS 0 


Definição 10.17 (cadeia de Jordan). Seja v um autovetor generalizado de ordem p para o autovalor A do 
operador T. Então a sequência de vetores 


mas 


V; 
(T p AL)v, 
(T a AT)?v, 
(T—AZ)P"!y 
é uma cadeia de Jordan, ou cadeia de autovetores generalizados, pertencente ao autovalor À, + 


Exemplo 10.18. Para o operador T, autovalor 1 e o vetor v do exemplo|10.16| uma cadeia de Jordan é 


Ui) 6) 
V, (T—Z)v = 2)» 0 < 
-1 0 


Teorema 10.19. Uma cadeia de Jordan pertencente a um autovalor de um operador é LI. 


Demonstração. Seja T um operador e 
u, Tu,...,T“u 


uma cadeia de Jordan (ou seja, T“u Æ 0, mas T*+lu = 0). Então, suponha que 
aqu+ayTu-+...+ acT*u = 0. 


Queremos mostrar que isto implica em todos os a; serem zero. 
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Já que Ttlu = 0, e o mesm vale para T4, com q > k, aplicamos T* sobra a combinação linear. 
Obtemos 


T*agu+raTTu+...+aTtku=o 
T*açu+0+...+0=0 
aoT*u = 0, 


o que implica que ao = 0. Podemos então reescrever a combinação linear sem o primeiro termo, já que 
ele será zero: 
ayTu+...+ acT*u =0. 


No entanto, podemos usar raciocínio análogo ao anterior para mostrar que ay = 0, e assim por diante, até 
ak = 0. Com isso temos todos os a; = 0, e a cadeia de Jordan é LI. E 


O exercício|259]pede a demonstração do teorema[10.21| que generaliza o teoremal10.19|para a união de 
várias cadeias de Jordan, 


Teorema 10.20. A união de cadeias de Jordan pertencentes a diferentes autovalores de um operador é LI. 
Teorema 10.21. Seja T um operador em um espaço V, com autovalores A, . . . , A. Então 


V= ker(T = AMT) D- P ker(T = AT), 


10.1.3 Existência da forma de Jordan (para operadores nilpotentes) 


Definição 10.22. Um operador linear T é nilpotente se existe a > O tal que TĦ = 0, O número a é o índice 
de nilpotencia de T. + 


Exemplo 10.23. Os operadores 


são nilpotentes, porque 


A? =0,B? =0,C? =0. 
Os índices de nilpotência de A, B e C são 2, 2e 3. 


Já o operador 
200 
D = diag(2,3,4) 5 k 3 o) 


004 
não é nilpotente, porque para todo k > 0, D* = diag(25, 3%, 4%). « 
Teorema 10.24. Se T éum operador nilpotente em um espaço V de dimensão n, então o único autovalor de T é zero, 
com multiplicidade algébrica n. 
Lema 10.25. Seja T: V — V um operador linear nilpotente. Existe uma base de V formada por cadeias de Jordan 
- ou seja, uma base da forma 


aq—1 


— -1 
(vi, Tvi.. TU vi, A Vip eras TT V2, a.e, Vay Vgs- T Va), 


com Tiv; =Q. 
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Demonstração. A demonstração é por indução na dimensão de V. 

Como base temos espaços de dimensão um: trivialmente, qualquer operador de dimensão um já está 
na forma de Jordan, porque já é diagonal. 

A hipótese de indução é a de que para todo operador T em um espaço V de dimensão k existe uma base 
onde T está na forma de Jordan. 

Presumimos que o posto do operador não é zero, e que também não é completo. Como a imagem de T 
tem posto menor que dim V, tomamos agora o mesmo operador T, mas restrito à sua imagem, T(V). Pela 


hipótese de indução, podemos encontrar vetores v1,...,Vq tais que 
aj—1 
vi; lvi,- A PV, 
a2—1 
Va, v2,. al E V2, 
ag—1 
Vas IVg eo T797 Vgs 


formem uma base para a imagem T(V), e Tv; = 0. 
Agora, para todo 1 < i < q, podemos escolher um vetor u; tal que T(u;) = vi. Obtemos então 


= 
UV, vi, TT O 
az—1 
U2,V2,[V2,..., [927 v2, 
ag—1 
Uq Vq Vq- cs TOS Vgs 
que é o mesmo que 
2 a 
u1, Tuy,[“us,..., T U, 
u2, Tu2,T2u2,..., Tu», 
ua, Tug, T U Tsu 
q, q, Gees q, 


com T“:*lu, = 0 para todo u;. Continuamos tendo então q cadeias de Jordan, que portanto são LI (pelo 


teorema[10.21). 


Continuamos agora observando que certamente, todos os vetores T“iu; pertencem a ker T. Temos 


então q vetores do kernel de T, e podemos extender este conjunto com mais m vetores W1, W2, ..., Wm 
para completar uma base para ker T. 
Os vetores 
fa a 
u1, lu, Tu, Tu, 
2 a 
u2, luz, T“u2,..., Tº2uo, 
2 a 
Ug,ug, Tug,..., TOU, 
W15W2,..05Wm 


são uma base do espaço V. Contamos as dimensões: 
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* A nulidade de Té q +m. 
* O posto de T é aj +... + aq. 
Pelo teorema do núcleo e da imagem, temos 


dim V =(aı +--+ aq) +q+m 
=(a1 +1)+:--+ (aq +1) +m, 


que é o número de vetores que temos. E 


Teorema 10.26. Seja T : V — V um operador linear nilpotente. Existe uma base de V em que a matriz do operador 
T é representada na forma de Jordan. 


Demonstração. Suponha que exista P tal que P=! TP = J, onde J está na forma de Jordan. Então particione 
P de acordo com os blocos de Jordan: 


P = (P1 P2... Px). 


Cada P; é composto de n; colunas: 


Pi = (Vi) V23.. e3 VEN 


Como P7 !TP = J, temos 
APi = Pihi = Pi(AiZ + Ni). 


Olhando para o bloco P;, temos 
(Avi, Ava, y ., AVn; ) = Alano. ' Vni) + (vz, V3, a ,Vni0), 


((A NT) (A — Ava, NA — AiZ)Vn: ) = (V2, Va) ces nO) 


ou seja, 


Assim, há uma base para V onde T fica na forma de Jordan se e somente se há uma base formada por uma 
cadeia de Jordan para cada autovalor. Com o Lemaļ|10.25| concluímos a demonstração. E 


Como os autovalores de um operador nilpotente são todos zero, sua forma de Jordan sempre terá a 
diagonal zero, zeros ou uns imediatamente acima da diagonal: 


0 


01 0 
0 01 0 
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10.1.4 Existência da forma de Jordan (caso geral) 


Mostraremos agora que a existência da forma de Jordan para operadores nilpotentes implica na sua exis- 
tência também para o caso geral. 

Primeiro, mostramos que o espaço vetorial V pode ser decomposto na soma direta dos kernels das ca- 
deias de Jordan de um operador T sobre V. 


Lema 10.27. Seja T um operador sobre um espaço V de dimensão finita, e A um autovalor de T. Então é possível 
decompor V em 
V=kerWekerl, 


tais que T é nilpotente em W, e a restrição de T a U é inversível, 


Demonstração. Considere os operadores T, T2, T? .... Como V tem dimensão finita, pelo teorema do núcleo 
e da imagem, deve haver algum k para o qual ker(T*) = ker(T*+1). Escolhemos o menor k tal que esta 
igualdade valha. 

Agora, também é claro que 


ker(T) Cker(T2) C -..CkerT(T*) = ker(T +) =... 


Tomamos W = ker(T*) e U = Im(T*), e argumentamos a seguir que estes subespaços satisfazem o 
enunciado do lema. 


e V=Wg U: A soma das dimensões está correta, pelo teorema do núcleo e da imagem. Agora, seja 
v € WALU. Isso é o mesmo que (i) v € W, e então T(v) = 0; (ii) v = T(x) para algum x € V. 
Então T2*(x) = 0, e x € ker(T2k) = ker(T*). Portanto, v = T* (x) = 0. Isso mostra que W & U é 
soma direta. 


* T énilpotente em W: trivialmente, porque W = ker(T*). 


* a restrição de T a U é inversível: seja v € ker(T) N U. Então T(v) = 0. Como U = Im(T*), então 
v = T*(x), para algum x € V. Poratnto T+! (x) = Tk(v) = 0. Isso é o mesmo que dizer que 
ker(T*) = ker(T*+1). O kernel de T restrito a U portanto tem somente o zero, e T éinversível. E 


Teorema 10.28. Seja T um operador sobre V, e A1,..., Ax os autovalores de T. Então existem ay, ..., ax tais que 
V pode ser decomposto em 


V=ker(T-AMTD) Eker(T-NATD) LL E. eker(AT)'*, 
sendo cada ker(T — A;T)“ invariante para T. 
Demonstração. Segue por indução no número de autovalores, usando o lemaf[10.27] E 


Teorema 10.29. Seja T : V — V um operador linear. Existe uma base de V em que a matriz do operador T é 
representada na forma de Jordan. 


Demonstração. E 


Exemplo 10.30. Abaixo temos um operador em Rt: 


+ OWN 
S0OWwWo 
OOo 
NON O — 


350 CAPÍTULO 10. FORMA DE JORDAN 


Os autovalores deste são 3, 1 e 4, e sua forma de Jordan é 


200W 
OCOtw— 
0+00 
»R 000 


10.2 Estabilidade numérica 


A matriz A mostrada a seguir já está na forma de Jordan. 


110 
A po 171 
001 


Se adicionarmos £ a uma das entradas da matriz, sua forma de Jordan muda consideravelmente (veja que 
agora a forma de Jordan é diagonal). 


110 l=-ye 0 o 
B=| 001 À To S O- +vE O 
0 01 0 0 1 


10.3 Aplicações 


10.3.1 Álgebra Linear [ forma de Jordan ] 


Uma intrigante aplicação da forma de Jordan é na demonstração de um teorema de enunciado absoluta- 
mente simples, mas cuja demonstração sem a forma de Jordan torna-se surpreendentemente complexa. 


Teorema 10.31. Toda matriz é similar a sua transposta. 


Demonstração. Sabemos que A = PJP”!, portanto basta mostrar que J é similar a J", que mostramos a 
seguir. 
A 1 1 A 1 
E Re: A nO), = m 
A 1 1 à 1 
Enunciamos também outro teorema que podemos provar facilmente usando a forma de Jordan. 


Teorema 10.32. Para qualquer matriz A, liMn—oo A” = 0 se e somente se os módulos dos autovalores de A são 
menores que 1. 


Demonstração. A é similar a J na forma de Jordan, que tem os autovalores na diagonal e elementos unitários 
acima da diagonal. Para cada bloco de jordan B, 


A2 2A 1 0- 0 

O A? 2A 1 
B2LQ): e 

0 

0 A2 2A 


O A? 


10.3. APLICAÇÕES 351 


An nAn! (5) AN—2 (3) AN—3 
0 Ao mato (Br? 
BM — . é 
Ar nan! 
0 aa An 
Cada linha tem, começando no elemneto da diagonal, os coeficientes da expansão binomial de (1 + A)”: 


Cos Cara (a 


Todas as entradas são da forma aN"-K, com k < n. Se |A| < 1, todos os valores tendem a zero. Claramente, 
se a matriz tende a zero em uma base, tenderá a zero em qualquer base, já que a representação do zero não 
depende de base. E 


10.3.2 Equações Diferenciais | forma de Jordan | 


Se um sistema dinâmico é descrito por uma matriz não diagonalizável, podemos usar sua forma de Jordan. 
Por exemplo, 


A solução para este sistema é 
x(t) = eUx(0), 


por isso só precisamos calcular et]. Como temos um único bloco de Jordan, já sabemos que teremos 


et]! — eP eN 


com 


Temos Nº = 0, portanto 


PA : 
Nt! 
tN — 
EN=) 5 
i=0 
NO Ne N 
10” 2 


100 Oto 1/0 0 t? 
=|0 Wol+lo ot t3 00 0 
001 000 00 0 
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Calculamos também 


Finalmente, temos 


et 0 0\/A t 1272 
0o 0 e#/ o 0 1 
e2t te?t ttet 

= 0 e?t te?t 


00 e?t 


A descrição de x em função de t é, portanto, 


x(t) = eYx(0) 


e?t te2t 142e2t 
0 et te? x(0) 
[o 0 e2t 
[O + t20) + EO 

= e | xo(0) + txa(0) 

x3(0) 
Finalmente temos 
2 
x) e (x (0) + txa(0) + É so) 
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Neste exemplo o sistema dinâmico já era descrito por uma matriz na forma de Jordan. É evidente que um 
sistema dinâmico poderia ser descrito por uma matriz A não diagonalizável, e que houvesse a necessidade 
de calcular P, PT! e J tais que A = PJP”!. Este processo é semelhante ao que usamos quando tratamos de 
sistemas dinâmicos na Seção[6.6.5] eo Exercício |[262]traz um sistema como este. 


tD stN 


Este método, descrevendo a solução como e*” etN é importante para a análise do sistema dinâmico e 


de sua solução, mas não é o mais eficiente para se computá-la. 
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Exercícios 


Ex. 257 — Calcule a forma de Jordan: 


POD sa DD 
001 101 000 ão 
022 
a= ài? o) s= (222) c-(203) D=]. 2 
100 101 3 1 : 
0 2 
0 2 à 


(D tem entradas igual a 2 somente na diagonal e nas posições imediatamente abaixo da diagonal) 


Ex. 258 — Prove o Lema[10.6] 
Ex. 259 — Prove o teorema|/10.21 


Ex. 260 — Seja T um operador nilpotente. Prove que (Z + T) não é singular. 


Ex. 261 — Dê um exemplo de matriz real de ordem 4 que não é similar a nenhuma matriz real na forma 


de Jordan. 


Ex. 262 — Descreva x(t) em função de x(0) (use a forma canônica de Jordan): 


xı (t) = 2x1(t) + x2(t) 
xa (t) = 2x2 (t) +x3 (t) 
x3 (t) = 3x3 (t) +x4(t) 
x4 (t) = 3x4 (t) 


xi (t) = 2x1 (t) + xa (t) 

x2(t) = 2x2 (t) 

x3 (t) = 3x3 (t) + x4 (t) 

x4(t) = 3x4 (t) 

x(t) = 4x1 (t) + x2 (t) + x3 (t) 
x(t) = 4x2 (t) + x3 (t) 

x$ (t) = 5x3 (t) + x4 (t) 

x4 (t) = 2x1 (t) + 5x4 (t) 
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Capítulo 11 


Reticulados 


Um reticulado é um subconjunto discreto de um espaço vetorial - em R", por exemplo, um reticulado é 
um conjunto de pontos dispostos de maneira regular. 


Definição 11.1 (Reticulado). Um reticulado é o conjunto de todas as combinações lineares de um conjunto 
B de vetores LI, onde os coeficientes das combinações são inteiros. O conjunto B é chamado de base do 
reticulado. 


Denotamos o reticulado com base B por £(B). 4 


Em outras palavras, um reticulado é um subconjunto de um espaço vetorial, onde os vetores são com- 
binações lineares inteiras da base. 

O conjunto de pontos com coordenadas inteiras em R” é um exemplo extremamente simples de reti- 
culado. 


Exemplo 11.2. Os inteiros são um reticulado. Uma base para este reticulado é +1, e outra é —1. < 
Exemplo 11.3. O conjunto {x : x = av2} com a € Z é um reticulado em R: sua base é 2, e o reticulado 


consiste de todas as combinações lineares (ou seja, os múltiplos) de V2. Este reticulado é mostrado na 
figura a seguir, com a base bı = v2 destacada. 


-3V2-2v2 —-v2. 0 v2 242 342 


Exemplo 11.4. A figura a seguir mostra um reticulado em Rĉ. 
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< 
Exemplo 11.5. O conjunto de todas as matrizes de ordem n com entradas pares é um reticulado. Seja B 
a base canônica para o espaço vetorial Mn. Multiplicamos todas as matrizes da base por 2, obtendo 2B, e 
L(2B) é o reticulado de matrizes pares. «4 
Exemplo 11.6. O conjunto de funções da forma 

asen(x) + b cos(x) 

no intervalo [—7, n], com a,b € Z é um reticulado. < 
Definição 11.7. Uma matriz quadrada A é unimodular se | det A| = 1. + 


Observe que se A é unimodular, det A7! = det A. 


Teorema 11.8. Sejam A e B duas bases para um reticulado. Então existe uma matriz unimodular U tal que A = 
BU. 


Demonstração. Denotamos A = {a1,...,an}e B = {b1, ..., bn}. Como A é base, então é possível escrever 
todos os b; como combinação linear inteira das colunas de A - ou seja, existe uma matriz M com entradas 
inteiras tal que AM = B. Mas B também é base, e mesmo vale - existe uma matriz N tal que BN = A. 
Temos, portanto, que AMN = A,ou MN = Z. Assim, det(M) det(N) = 1. Mas det(M) e det(N) são 
inteiros (porque as duas matrizes são inteiras), por isso det(M) = det(N) = 1. E 


Definição 11.9 (domínio fundamental). Seja L = £(B) um reticulado. Então o domínio fundamental de L 
dado pela base B, que denotamos F(B), é o conjunto de combinações lineares de vetores da base B com 
coeficientes (não apenas inteiros) 0 < a; < 1. 


F(B)=(x:x=5 ab a € [0,1),bi € B}. + 


Exemplo 11.10. Em R” o domínio fundamental é o paralelepípedo definido pelos vetores da base e seu 
volume é, por definição, o determinante da base. A figura a seguir mostra um reticulado em R?, com sua 
base, formada pelos vetores by e b2. 
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< 

Exemplo 11.11. Com a base asen(x) + bsen(x),e x € [-7, +7], temos um reticulado. Seu domínio 
fundamental é o conjunto 

fasen(x) +b cos(x) : a,b € [0,1)) < 

Como diferentes bases para um mesmo reticulado podem ser obtidas pela multiplicação por uma ma- 


triz unimodular, concluímos que o determinante de todas as bases de um reticulado é o mesmo. Isso nos 
permite definir o determinante do reticulado. 


Definição 11.12 (determinante de um reticulado). O determinante de um reticulado em R” é o módulo do 
determinante de qualquer uma de suas bases. 4 


Fica claro também que o volume do domínio fundamental de um reticulado não depende da base. 


11.1 Ortogonalidade de bases 


Definimos desvio de ortogonalidade apenas para bases de vetores de R”. É possível generalizar esta defi- 
nição para espaços quaisquer, inclusive espaços de funções (desde que tenham bases), mas isto fica fora do 
escopo deste texto. 


Definição 11.13 (desvio de ortogonalidade). Seja B = {b1,b2,..., bn} uma base para um reticulado, 
subconjunto de R”. O desvio de ortogonalidade da base B é 


_ Hill 
(B) = der BT" + 


Claramente, o desvio de ortogonalidade é 1 se a base é ortonormal, e maior que 1 caso contrário. A 
figura mostra, à esquerda, uma base com desvio de ortogonalidade baixo; à direita, outra base para o mesmo 
reticulado, com desvio maior. 


358 CAPÍTULO 11. RETICULADOS 


Exemplo 11.14. Seja 


uma base. Seu desvio de ortogonalidade é 


I2, Ds] 45 
[det B| 4 =n5. 


Podemos obter outra pase para o mesmo reticulado aplicando uma transformação unimodular - por exem- 


plo, 
u= 8 3 
—5 —2 
AuU= (a E, 
8 3 


es, BT MZ 3] 4V5V BA 
daan = 4 Q. 


A nova base é 


A base AU tem desvio de ortogonalidade 


11.2 Problemas em reticulados 


Nesta seção definimos alguns problemas em reticulados e algoritmos para resolvê-los. 


Definição 11.15 (problema do menor vetor (SVP)). Seja £ um reticulado em um espaço com produto in- 
terno. Um menor vetor de £ é um vetor não nulo em £ com a menor norma dentre todos. 4, 


Definição 11.16 (problema do vetor mais próximo (CVP)). Seja £ um reticulado em um espaço V com 
produto interno. Dado v € V, o vetor em L mais próximo de v é o vetor w € £ com a menor distância 
d(v, w). + 


Definição 11.17 (problema da menor base (SBP)). Seja £ um reticulado em um espaço com produto in- 
terno. Uma menor base para £ é uma base que minimiza alguma norma que se defina para bases. + 


Quando o desvio de ortogonalidade e a dimensão do reticulado são grandes, estes problemas são difíceis. 
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11.2.1 Redução de bases com posto dois: algoritmo de Gauss-Lagrange 


Para reticulados de dimensão dois há um algoritmo que permite encontrar eficientemente uma base de 
tamanho mínimo. 

Em R2, dois vetores não nulos são LI (e consequentemente formam uma base) se e somente se não são 
multiplos um do outro. Assim, quaisquer dois vetores formando ângulo diferente de zero são LI. 


Tomamos como exemplo bı = (3,2)! e b2 = (6,8)! , mostrados na figura a seguir. 


Fixe bı. Podemos subtrair de bz projeções de bz em bı, obtendo outros vetores, e menor vetor que podemos 
obter desta forma será ortogonal a by (que conseguimos ao subtrair de bz sua projeção ortogonal em b1). 


Infelizmente, a projeção ortogonal pode não ser um múltiplo inteiro de bı (e o vetor ortogonal bs portanto 
pode não pertencer ao reticulado). A intuição nos diz, no entanto, que podemos tomar o múltiplo mais 
próximo, arredondando o coeficiente. 


Subtraindo de b2 sua projeção ortogonal em bı temos 5 (—24, 36)! , que não pertence ao reticulado. 
O múltiplo de bı que subtraímos de b; é 


(b1,b2) _ 34 
E 13 “2815, 


que não é inteiro. Arredondamos, e usando k = 3 calculamos b = bz — 3b; = (—3, 2)". 


360 CAPÍTULO 11. RETICULADOS 


Conseguimos uma nova base, e reduzimos o maior vetor da base original. Podemos realizar outros 
passos para tentar obter bases ainda menores. Só teremos que, na próxima vez, trocar os vetores, para que 
subtraiamos do maior vetor um múltiplo do menor vetor. 

Claramente, não é possível continuar reduzindo o tamanho dos vetores indefinidamente, e em algum 
momento deveremos parar. 

Definimos que a base já está reduzida (e que portanto podemos parar o processo de redução) se um 
passo de subtração não resultar em uma base menor. Pararemos quando |Jb+ || < |b5|| < IJbz||. 


Definição 11.18 (base reduzida de reticulado, no sentido de Gauss-Lagrange). Seja L um reticulado em R?, 
Uma base B = (by,bz) para L é reduzida no sentido de Gauss-Lagrange se 


b|| < |lb2|| < |lbz + kbrll, 
para todo k € Z. + 


Com o passo de redução de base e o critério de parada, já podemos descrever o algoritmo de Gauss- 
Lagrange. 


Método 11.19 (algoritmo de Gauss-Lagrange). Tem-se uma base (b1, b2)" para um reticulado em RŽ. 


* Se ||b2]| < |lb1|| troque ||b; || com |b2|| 


* Seja 
um È | 
[ba ||2 
* Se k = O pare; a base já está reduzida. 
* Subtraia kb; de b2. 
* Recomece. 
Ao término do algoritmo, bı e bz estão entre os menores vetores do reticulado. ) 


Se k = 0 então a multiplicidade estava em [-0.5, +0.5] antes de arredondar. Isso significa que tería- 
mos que subtrair uma parte muito pequena da projeção ortogonal, e que portanto bı já está próximo de 
ortogonal a bz. Não nos adianta subtrair múltiplo inteiro de vı. E como vı é menor que vz, não adianta 
também trocar os vetores. 
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Exemplo 11.20. Seja (3, 15)", (9,25)! uma base. Usamos o método de Gauss-Lagrange para reduzí-la. 


bill =11(3, 15)" = 15.3 
|bzll =|1(9,25) "Il = 26.6 


Escolhemos 


p = | 6:1597, 9,250 [402] > 
= (3,15) IP = 


Calculamos portanto 
(9,257 — 2(3,15)7 = (3, —5)" 
e temos uma base menor: 


lb! =|1(3, 15)" = 15.3 
IIb>|| =||(3, 5)" || = 5.8 


Trocamos os vetores, 


[bi =11(3, —5)" I| = 5.8 
lb2]| =II(3, 15)" -= 15.3 


e começamos novamente 


ey ((3,—5)", (3,15)") e: 66 E 
Ga | IE |7 [3 edi 


Subtraímos 
(3,15) + 2(3,-5)" = (9,5)". 


Agora temos 


llb: li =||(3, 5) || = 5.8 
Ilb2l| =||(9,5) "|| = 10.2 


Como ||b: || < ||b>||, desta vez não precisamos trocar os vetores. Novamente calculamos k: 


k= E | = |å] =° 


II(3, 5) IP 34 
Temos agora uma base formada pelos dois menores vetores do reticulado. < 


O algoritmo de Gauss-Lagrange não pode ser generalizado para espaços de dimensão maior sem tornar- 
se muito ineficiente. 
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11.2.2 Vetor mais próximo com posto e ortogonalidade altos: algoritmo 
de Babai 

Apresentamos nesta seção o algoritmo de Babai. A partir de uma base B e um ponto qualquer x € R”, o 

algoritmo de Babai encontra um ponto y pertencente a L(B). Se B tiver desvio baixo de ortogonalidade, o 

ponto y será próximo do vetor mais próximo de x. 

Se B = (by,...,bn) é uma base para um reticulado de posto n, então B tem posto n, e portanto é 
também base para R”. Assim, podemos descrever qualquer ponto de R” como combinação linear da base 
B: 

x = (x1b1,...,Xnbn)". 


Usaremos isto na descrição do algoritmo de Babai. 


Método 11.21 (algoritmo de Babai). Seja £ umreticulado com base B = {b1,. . . , bn}. Seja (x1b1,...,xnbn)!, 
com x; € R um ponto qualquer em R” (note que este ponto não necessariamente pertence ao reticulado, 
já que os x; podem não ser inteiros). O algoritmo de Babai simplesmente arredonda os coeficientes, 


dj = Ixil, 


e retorna o ponto do reticulado 


(aibi, ..., anbn): 


Tendo um ponto qualquer p em R”, portanto, obtemos os coeficientes 
p qualquer p p 
x=B'p, 


e o ponto mais próximo será 
B|x]. º 


Exemplo 11.22. Damos um exemplo em Rĉ?, para que possamos ilustrar também com um gráfico. Seja 


"=(83) 


uma base, e x = (5,2)! um ponto fora de L(B). Então 


e (à NEE) 


Arredondamos, obtendo (2, 1)". O ponto mais próximo é 


B(2, )t.= (6,2)". « 


11.2.3 Posto alto, ortogonalidade baixa (reticulados difíceis) 


Para bases pouco ortogonais e com posto algo há outros algoritmos, mas nenhum deles dá a solução exata 
e executa em pouco tempo. Um algoritmo muito conhecido para este problema é conhecido por “LLL” 
(que são as iniciais dos autores do algoritmo - Lenstra, Lenstra e Lovasz), que é uma variação do método 
de ortogonalização de Gram-Schmidt. O leitor interessado por encontrar mais informações nos livros de 


Steven Galbraith [Gal12] e de Hoffstein, Pipher e Silverman [HPs08]. 
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11.3.1 Criptografia [ reticulados; desvio de ortogonalidade | 


O criptossistema GGH foi proposto em 1997 por Goldreich, Goldwasser e Halewi [66H97]. Este criptossis- 
tema foi “quebrado” - o que significa que não pode ser usado na prática porque não é seguro. Apesar disso, 
é um excelente exemplo de como problemas em reticulados são usados em Criptografia. 

Neste criptossistema, cada participante tem um reticulado £. Sua chave privada é uma base “boa” (com 
desvio de ortogonalidade muito baixo), e a chave privada é uma base “ruim” (com desvio alto). Cada ponto 
do reticulado é uma mensagem que pode ser enviada. 

De posse da base pública, qualquer um pode encriptar uma mensagem: sejam € £ a mensagem. 
Para encriptar, basta deslocar ligeiramente a mensagem, resultando num ponto em R”, fora do reticulado, 
mas perto de m. para obter a mensagem original, deve-se resolver o problema do vetor mais próximo. 
Como a base que todos conhecem (a chave pública) tem desvio de ortogonalidade muito grande, o esperado 
era que ninguém conseguisse resolver o problema e decifrar a mensagem. Já a base privada tem desvio 
de ortogonalidade baixo, por isso com ela é fácil obter m a partir da mensagem encriptada. A seguir, 
detalhamos parcialmente o funcionamento do criptossistema. 

Primeiro, uma base B ortogonal (ou quase ortogonal) é criada. A base “ruim” R (com desvio de ortogo- 
nalidade grande) é criada a partir de B. Uma das maneiras de obter R é criar uma sequencia U1, Uz,..., 
Ux de matrizes unimodulares geradas aleatoriamente: basta gerar matrizes triangulares superiores (ou 
inferiores) com a diagonal igual a 1 e números inteiros aleatórios nas outras entradas. Assim, 


R = BU: U2- Uk. 


Como as matrizes U; são unimodulares, R é base para o mesmo reticulado gerado por B. Mas como as Ui; 
tem entradas aleatórias acima (ou abaixo) da diagonal, R terá um desvio de ortogonalidade grande. 

Para encriptar uma mensagem m € L, criamos um vetor de erroe = (e1, €2,..., €n), € somamos à 
mensagem. A mensagem encriptada será 


c=mR +e, 


ou seja, o erro é somado aos coeficientes do ponto m na base R. O erro deve ser pequeno, de forma que c 
continue mais próximo de m do que de qualquer outro ponto do reticulado. 

Para decifrar, usa-se o algoritmo de Babai que determina o ponto mais próximo de c no reticulado, 
usando a base B. Com isso obtemos mR. Para obter os coeficientes, basta multipicar por R7!. 


Exemplo 11.23. Damos agora um exemplo minimalita do funcionamento do GGH. 
Primeiro escolhemos uma base privada (com desvio pequeno). 


120 992 544 
B=|20 —2273 4141 
30 —3 —2 
Escolhemos uma matriz unimodular U: 


1 — 10500 350 
1520 —15959999 537000 


25000 —262530001 —141254999 
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A base R é 


100070060 —1050859866414 —586157544859 


[noob —158649899552 ER) 
—54530 572624999 280909498 


Os desvios de ortogonalidade de Be R são 


Q 


5(B) =8 
S(R) =3.9 x 1022. 


Escolhemos uma mensagem, 


m = (2,4,6)!. 
Um vetor de erro 
e= (10,-5,8)". 
O texto cifrado é 
—1092429223014 
c = Rm +e = | 7720184594695 
3975847932 


Para decifrar, obtemos as coordenadas de c na base B e arredondamos 


= 39897 
x=[|B"'c]=| 60614956 |- 
1897599998 


Reescrevemos na base B 


—7720184594690 


(27720184524620 
Bx = 
3975847924 


e obtemos as coordenadas na base R 
R~! (Bx) = (2,4,6). 


A base B é fundamental para decriptar. Se usássemos somente a base R teríamos as coordenadas 


60308114400 


Pio A (Casasia) 
cha |R'e] = 
—12061617 


Este ponto na base B é 


—8136001665837 


ad (8136001665837 
X = . 
4203990954 


O criptossistema GGH infelizmente não é seguro: o criptanalista Phong Nguyen mostrou que existe uma 
maneira de decifrar as mensagens sem usar a chave privada. 

Os livros de Hoffstein, Pipher e Silverman [HPsos), de Galbraith e o de Goldwasser e Miccian- 
cio permitem compreender em maior profundidade reticulados e sua aplicação em Criptografia. 
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11.3.2 Cristalografia [ reticulados | 


(Esta seção está incompleta) 

Cristais são sólidos cujos átomos se organizam espacialmente como os pontos de um reticulado. 

O livro de Nevill szwacki e Teresa Szwacka [SS10] e o de Schwarzenbach [Sch96] tratam de reticulados 
em cristais. 


Exercícios 


Ex. 263 — Quantas bases pode ter um reticulado em R? E em R? e R”, de maneira geral? 


Ex. 264 — Para todo n, o espaço vetorial R” não é reticulado, porque claramente admitimos combinações 
lineares não inteiras da base. Há espaços vetoriais que também são reticulados? 


Ex. 265 — Seja (V, +, -) um espaço vetorial, Prove que um subgrupo aditivo (S, +) é discreto (não é con- 
tínuo) se e somente se os elementos de S são os elementos de um reticulado. 


Ex. 266 — (Daniele Micciancio) Encontre um conjunto de vetores B tal que L(B) não seja um reticulado. 


Ex. 267 — Os n primeiros termos de uma série de Fourier são um reticulado. Mostre como calcular o 
volume de seu domínio fundamental. Tente dar uma interpretação a ele. 


Ex. 268 — Encontre uma base Gauss-Lagrange-reduzida para o reticulado com base (3, 28)", (4,11)". 
Ex. 269 — No exemplo[11.14] demos duas bases para um reticulado em R?, uma delas com desvio de or- 


togonalidade v5. Prove que esta base é a menor no sentido de Gauss-Lagrange, ou mostre uma que seja 
menor que esta. 
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Capítulo 12 


Formas Quadráticas e Bilineares 


No Capítulo [5] definimos formas multilineares, e construímos o determinante como forma multilinear. 
Agora voltamos a atenção a um caso especial: as formas bilineares, funções de dois argumentos, e line- 
ares em cada um deles. 


12.1 Formas Bilineares 


Uma possível definição para formas bilineares seria a seguinte. 
Definição 12.1 (Forma bilinear). Uma forma bilinear é uma forma multilinear com dois argumentos. 4 


Damos também uma definição mais explícita, que é mais comum em textos introdutórios de Álgebra 
Linear. 


Definição 12.2 (Forma bilinear). Uma função f : U x V > R é bilinear se 
* Dado u € U, f(u, -) é linear em seu segundo argumento. 
* Dado v € V, f(-,v) é linear em seu primeiro argumento. + 


Teorema 12.3. Toda forma bilinear f(x, y) sobre R, Q ou C, sem termos lineares, pode ser representada por uma 
matriz B, de forma que 
f(x, y) =x By 


Demonstração. (Esta demonstração é um tanto informal) 
Uma forma bilinear deve necessariamente ser como 


Q11X1Y1 + 012X142 + 


sem que haj a termos quadráticos (x2) nem constantes. 
Expandimos x! By, obtendo 
yı 
(X13. --3Xn)B : 
Yn 
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Yı 
= (xı b11 +x2b021 +e + Xnbni +: + Xnbin +X2b2n +: + Xnbnn) : 
Yn 
yı 
= J bux Piik J binx : 
$ i 
Yn 


=y1 bx bus) rs Ea pa bios] 
i i 
-J J tura 
j i 
e portanto temos todas as combinações de x; com yj com diferentes coeficientes. O coeficiente de xiyj 
será o elemento bij. E 
Exemplo 12.4. A forma bilinear 


f(x,y) = 2x1y7 — 3x1V2 + x241 — 5x2y42 


2 —3 
1-5) 
(x1,2) (2 y2) (») = 2x1U1 3x1Y2 E Xx2U1 5x292. < 
1 —5 y2 
Definição 12.5 (forma bilinear simétrica). Uma forma bilinear f(x,y) é simétrica se f(x, y) = f(y, x). 4 


O Exercício|271|pede a demonstração da proposição 


Proposição 12.6. Toda forma bilinear simétrica é representável por uma matriz simétrica. 


é representada pela matriz 


porque 


Corolário 12.7. Toda matriz que representa forma bilinear simétrica é diagonalizável. 


12.1.1 Com termos lineares 


Sejam x e y vetores com n componentes. Defina 


qm diz ce qin | pı X1 yı 

q21 q22 p2 X2 Y2 

B= : Ses | “15 = , y’ = : 
Ano Qnno) Pn Xn Yn 

S1 S2 ce Sn iv c 1 1 


Note que marcamos uma submatriz quadrada de ordem tres. Essa submatriz representa a forma bilinear, 
quando ignoramos os termos lineares (e estes, por sua vez, são representados na linha e coluna adicional). 


Então 
(x! By’ = > qijXiYj + DE TiX + 2 Siyi +C 
ij i i 
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Exemplo 12.8. A forma bilinear 
2x141 — 3x1y3 + x2y3 — 9x3y2 — X1 + 4x2 — 5x3 + y2 +2 


é representada pela matriz 


2 0 -3i0 
A- 0 0 1:1 
0—2 io 
— 4 —5:i2 
de forma que, se 
yı 
x’ = (xı X2 X3 1), y = |22], 
Y3 
1 
então 
x 2.0.0 88/0) fu 
nTAyv=|*2 O 0 111 y2 
w) ad h AT o ol las 
17 a 4 52 14 
= 2x1y1 — 3x1y3 + x2y3 — 9x3y2 ~ x1 + 4x2 — 5x3 + Y2 + 2. < 
12.2 Formas Quadráticas 
Definição 12.9 (forma quadrática). Uma forma quadrática em x é uma forma bilinear f(x, x). + 


Toda forma quadrática real, racional ou complexa, portanto, pode ser descrita como x! Qx, onde Q é 
uma matriz. É claro também que toda forma quadrática é bilinear simétrica. 


Exemplo 12.10. Não é verdade que formas quadráticas em qualquer corpo podem ser representadas por 
matrizes simétricas. Por exemplo, em Z2, a forma 


X1X1 O X1X2 


não pode ser representada por matriz simétrica. Ela pode, no entanto, ser representada pela matriz trian- 


gular 
114. « 
(a) 


l4 


Definição 12.11 (matrizes definidas e semidefinidas). Uma matriz A com autovalores A1,...,An é 
i) definida positiva se A; > 0, 
ii) definida negativa se A; < 0, 
iii) semidefinida positiva se A; > 0, 


iv) semidefinida negativa se A; < 0, 
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v) indefinida se tem autovalores positivos e negativos. + 


Exemplo 12.12. Considere as matrizes 


a D De 
01 01 0 — 
A tem autovalores —2 e 1, portanto é indefinida. B tem autovalores 1 e 2, portanto é definida (e semidefi- 


nida) positiva. C tem autovalores 0 e —1, portanto é semidefinida negativa. < 


O teoerma|12.13|explicita propriedades importantes de matrizes definidas e semidefinidas. Sua de- 
monstração é pedida no exercício 


Teorema 12.13. Uma matriz A é 
i) definida positiva sex! Ax > 0, Vx £ 0; 
ii) definida negativa se x! Ay < 0, Yx £ 0; 
iii) semidefinida positiva sex! Ax > 0, Vx; 
iv) semidefinida negativa sex! Ay < 0, Vx; 
v) indefinida se x! Ax pode ser positivo ou negativo. 
Disto podemos concluir que 


Corolário 12.14. O determinante de uma matriz (semi)-definida positiva é positivo, e o determinante de uma matriz 
(semi)-definida negativa é negativo. 


Corolário 12.15. Matrizes definidas (positivas ou negativas) não são singulares. 


EE 
13 
é definida positiva, porque para qualquer vetor x = (x1,x2)! Æ 0, 
(x, Ax) = x! Ax 
æ 3x? + 3x5 + 2x1Xx2 


2x3 + 2x5 + (x$ + 2x1x2 + x2) 
= 2x4 + 2x3 + (x1 + x2)? 


Exemplo 12.16. A matriz 


, 
que é a soma de três quadrados, que sempre será positiva. < 


Exemplo 12.17. Uma matriz com elementos não-negativos não necessariamente é semidefinida positiva. 


A matriz 
G 
1 0 


não é semidefinida positiva: seja x = (1, —5)T. Então, 


(x, AX) = x! (Ax) 


U, —5) (2 ) as (2 1) 


= (1,—5)(—3, 1)! = —8. «4 
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Exemplo 12.18. Uma matriz definida positiva não necessariamente tem todos os elementos positivos. Por 
exemplo, 
died 5 -l1 
-1 5 


xl Ax = 5x7 + 5x4 — 2x1 x2 
= 4x3 + 4x3 + (x1? — 2x1x2 + x5) 


= 4x1 + 4x5 + (x1 + x2) 


O Exercício|273|pede a demonstração do Teorema[12.19 
Teorema 12.19. Se A e B são definidas positivas e k € R”, então também são definidas positivas A + B e kA. 


Na demonstração do Teorema/12.20/usamos o fato de uma matriz ser semidefinida positiva para deter- 
minar uma desigualdade a respeito do determinante de matrizes com valores positivos. O Exercício 
pede a demonstração do mesmo resultado para o valor absoluto do determinante. 


Teorema 12.20. Seja A um operador descrito por uma matriz com valores estritamente positivos. Então 


det À < HI Aii. 
i 


Demonstração. Tomamos a representação de A como matriz. Suas entradas diagonais são maiores que zero, 
portanto podemos definir 
1 


, 
V Qi 
ou seja, di; é o inverso da raiz do i-ésimo elemento da diagonal de A. 
Seja D a matriz contendo somente entradas diagonais d;. Então 


di = 


B = DAD 


é simétrica e semidefinida positiva. Além disso, a diagonal de B somente contém uns. 
Usando as propriedades de determinantes, temos 


det B = det A det(DD) 
1 2 
detB = det À (=) 
JI y lii 
det A 
ai 
HI aii det B = det A, 


det B = 


e só precisamos mostrar portanto que det B < 1. 
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Sejam by,..., bn os autovalores de B, que são todos não negativos, porque B é semidefinida positiva. A 
média aritmética destes valores não é maior que a geométrica, ou seja, 


Como a diagonal de B só contem uns, Tr B = n, e temos 


detB < 1. E 
Exemplo 12.21. A matriz 
e (5 1 
15 
é positiva. O produtório de sua diagonal é 25, e seu determinante é —24. < 
Exemplo 12.22. A matriz 
325 
A=11 20 
114 
só tem valores positivos. O produtório de sua diagonal é 24, e seu determinante é 7. « 


12.3 Formas multilineares 


Da mesma maneira que definimos e pudemos representar formas bilineares como matrizes, também é pos- 
sível dar um tratamento semelhante a formas multilineares. Estas, no entanto, são mais naturalmente re- 
presentáveis como tensores, que são semelhantes a matrizes, mas onde usamos mais de dois índices, como 
“Qijkimn”, por exemplo. Tensores ficam fora do escopo deste texto. 


12.4 Aplicações 


12.4.1 Classificação de cônicas e quádricas 


Cônicas, e quádricas e suas matrizes 


Tomamos as cônicas e quádricas e examinamos as matrizes que as definem. 

Uma cônicd'|é a interseção de um cone circular com um plano em Rº. 

O cone circular é obtido pela revolução de uma reta não coincidente com o eixo das ordenadas, como 
ilustra a próxima figura. 


10u seção cônica. 
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Examinaremos a seguir as cônicas e quádricas, de um ponto de vista geométrico. Na seçãoseguinte 
trataremos de sua classificação de acordo com propriedades de duas formas quadráticas. 


* elipse ou circunferência: obtida com um plano, não paralelo à geratriz do cone, e que o intercepta so- 
mente em uma de suas metades. Nas figuras a seguir, os planos que interceptam o cone são dados 
por z = 3/2 (definindo uma circunferência) e x + 3z/2 = 3/2 (definindo uma elipse). 


zS 
40, 


A equação da elipse é 


e a matriz que dá sua forma quadrática é 
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* hipérbole: obtida com um plano que intercepta o cone em suas duas metades 


2 2 
nr 
a b2 


Na figura a seguir, o plano que intercepta o cone é dado por y = 1. 


* parábola: quando o plano é paralelo à geratriz do cone. 
ax? — y =k. 


Na figura a seguir, o plano que intercepta o cone é dado por 2x + 2z = 2 (portanto paralelo a ele). 


As 


A parábola, no entanto, não pode ser descrita somente como forma quadrática - ela tem um compo- 
nente linear. Descrevemos a parábola como x! Ax + by, onde 


a= (e JE b = (0,1)7. 
oo 


O fato de não conseguirmos representar a parábola sem componentes lineares relaciona-se com um 
importante fato: a parábola não tem um centro, ao redor do qual seja completamente simétrica (as outras 
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cônicas podem ser divididas em quatro partes que podem ser obtidas umas das outras por reflexões em dois 
eixos ortogonais). Trataremos disso mais adiante, já que também é verdade para parabolóides em qualquer 
dimensão. 

Procedemos agora às quádricas, definidas em Rº. Representaremos as formas quadráticas como matri- 
zes de ordem quatro, mas identificando também a submatriz de ordem três que se obtém desconsiderando 
os termos lineares. 


* elipsóide 


2 2 2 
+ rita Éh 
com todos os termos positivos, e cuja matriz é 
Io To o 
O 0,0 
270 dio 
O 0 O: 
A figura a seguir mostra um elipsóide com a = 2,b = 1,c=3ek =2 


* hiperbolóide de uma folha 


x2 y 2 z2 


a? b? c2 ” 


com dois termos positivos. Mostramos aqui somente o caso em que z é negativo, mas pode-se reor- 
denar as variáveis. A matriz é 


A figura a seguir mostra um hiperbolóide de uma folha com a = b = c = 2 e k = 1/2. 
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* hiperbolóide de duas folhas 


D 2 2 
E -2 
a b2 c2 
com dois termos negativos, e cuja matriz é 
> 0 0/0 
O —s 0f 0 
0 00-51 0 


A figura a seguir mostra um hiperbolóide de duas folhas com a = c = 2, b = 1 e k = 1/2. 


zZ 


* cilindro elíptico 


2 2 
QE 
a? b? 
com somente dois termos positivos e o terceiro igual a zero. A matriz desta forma é 
4 00i O 
Oo & 0: 0 
ORAR PR 0: 
0 0 0: 


A figura a seguir mostra um cilindro elíptico com a = 2,b = 1 e k = 1/2. 
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* cilindro hiperbólico 


2 2 
SU 
a? b? 
com um termo positivo e um negativo. A matriz é 
+ 0 0; io 
0 ij 0i 0 
Daea 00 Å O 
0 0 0; 


A figura a seguir mostra um cilindro hiperbólico com a = b = 2e k = 1/2. 


Assim como não podemos descrever parábolas sem adicionar à equação quadrática um termo linear, o 
mesmo acontece com todos os parabolóides. 


* parabolóide elíptico 


yo e=k 
Em forma matricial, temos 
4 ool o0 
O & 0i 0 
E OE O E a 
O 0 0: 


A figura a seguir mostra um parabolóide elíptico com a =b=2ec=k=1. 
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* parabolóide hiperbólico, que é simétrico ao redor de um ponto de sela, e é definido pela equação 


x y? 
P + bZ +ez=k 
A matriz que o representa é 
-4 00 0 
O$ 0,0 
DO OU 
O 0 0: 


A figura a seguir mostra um parabolóide hiperbólico com a = b = 2ec=k =1. 


* cilindro parabólico, definido pela equação 


ax—cy=k 


A matriz que representa um cilindro parabólico é 


4 00i 0 
000 c 
0000 
0 0 0: 


A figura a seguir mostra um cilindro parabólico com a = 2e c = 1 ek = 2. 
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Uma superfície tem um centro se pode ser obtida pela reflexão de um de seus octantes em R? (ou or- 
tantes em R”). 


Definição 12.23 (centro de superfície). Seja uma superfície qualquer em R”, Se existe um ponto x tal que, 
para quaisquer 61,...,ôn e qualquer índice i, se 


(x181; X2+ ô2;..., Xi + Ôi; . Xn + ôn) 
O 


pertence à superfície, então 


(x1 +01,x2+02,..59X—di..Xn+Ôn) 
e O 


também pertence (ou seja, podemos trocar o sinal de qualquer 51), então x é o centro da superfície. 4 


Elipsóides, hiperbolóides e seus respectivos cilindros são superfícies com centro - ou seja, estas super- 
fícies são compostas de partes simétricas ao redor da origem. 


Exemplo 12.24. Ilustramos na figura a seguir um hiperbolóide de uma folha, coma = b = c = 2,e 
k = 1/2: 


Apenas alguns dos pontos simétricos são mostrados. 
Como a figura não está transladada, seu centro é (0,0,0)!. Assim, queremos que 


(0 + 61)? 
22 


(0 +52)? (0+ 53)? 
22 22 


1/2=0 
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implique em 


(0581)? (046) (0463) 
a = —1/2=0 
mas isto sempre é verdade, porque teremos 5? = (—5;)?. < 


O mesmo não acontece com os parabolóides - estes não tem centro, por causa da presença do termo 
linear, que se comporta de maneira diferente para argumentos positivos e negativos. 


Determinando o tipo de uma forma quadrática 


Dada uma forma quadrática qualquer, definida por uma matriz A, queremos saber que tipo de forma ela re- 
presenta, geometricamente. Podemos fazê-lo facilmente por inspeção, se houver apenas termos da forma 
ani, mas não tanto quando há termos da forma axx;x;. 


2 
Exemplo 12.25. Como já vimos na seção[12.4.1| a equação Es bs + a = 1 define um elipsóide, e a 
2 
equação e dd = = 2 define um hiperbolóide de duas folhas. 
No entanto, não é imediatamente fácil determinar que tipo de figura é definida pelas equações xy + 
z? = l e xy — yz + z? = 2, por causa da presença dos termos xz na primeira equação e dos termos xy e 


yz na segunda. < 


Uma observação importante que podemos fazer é que as quádricas que vimos serem fáceis de classificar 
são representadas por matrizes diagonais, e sua classificação depende da quantidade de autovalores positivos, 
negativos e iguais a zero. 

Assim, para classificar uma forma quadrática não diagonal, deveremos obter seus autovalores. Podemos 
fazer ainda mais - sabemos que uma forma Q qualquer é similar a uma matriz diagonal D: Q = P7! DP. 
Se obtivermos P, podemos descrever a quádrica em questão através de uma simples mudança de base. 

Definimos então a inércia de uma matriz, que nos informará diretamente o tipo de uma quádrica qual- 
quer, dada sua matriz. 


Definição 12.26 (inércia de uma matriz). A inércia de uma matriz M é a tripla n(M) = (p,n, z), onde 
p, n, z são as quantidades de autovalores positivos, negativos e zero da matriz. + 


A inércia das duas matrizes que identificamos nas formas quadráticas determinam o tipo de forma geo- 
métrica que elas definem. Da descrição das cônicas e quádricas e suas matrizes, imediatamente percebemos 
que a classificação é como se dá nas tabelas a seguir. 

Para as cônicas, temos uma única matriz de ordem 2, e sua inércia determina completamente a forma 
geométrica. 


(p,n, z) | classificação 
(2,0,0), (0,2,0) | elipse 

(1,1,0) | hipérbole 
(1,0,1), (0,1,1) | parábola 


Para as quádricas, denotamos por (p, n)4 os autovalores positivos da matriz de ordem 4, e por (p, n)3 os 
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da submatriz de ordem 3. 


(p;nJ4 | (p,n); | classificação 
4,0 (3,0) | elipsóide 
2,2) | (2,1) | hiperbolóide (1 folha) 
3,1 (2,1) | hiperbolóide (2 folhas) 
3,1 (2,0) | parabolóide elíptico 
2,2 (1,1) | parabolóide hiperbólico 
2,1) | (2,0) | cilindro elíptico 
2,1 (1,0) | cilindro parabólico 
2,1 (1,1) | cilindro hiperbólico 


Separamos, na tabela, as quádricas com centro; em seguida, as sem centro (o posto da matriz maior é 
completo, mas o da menor, não); e em seguida, os cilindros (ambas as matrizes são singulares). 


Exemplo 12.27. Os exemplos que demos anteriormente de cônicas e quádricas ilustram a classificação 
(demos a descrição de cada uma delas como matriz diagonal, de onde pode-se trivialmente extrair os au- 
tovalores). < 


Claramente, dada uma elipse ou elipsóide, podemos determinar uma região limitada de R? (ou Rº) 
que o contenha. O mesmo vale para qualquer forma quadrática semidefinida positiva, conforme o teo- 
rema/12.28| cuja demonstração é pedida no exercício 


Teorema 12.28. Uma matriz é semidefinida positiva se e somente se a figura definida por sua forma quadrática em 
R” pode ser contida em uma região limitada. 


Eixos principais 


Como formas quadráticas são representadas por matrizes diagonais, podemos sempre diagonalizá-las. O 
processo de diagonalização é simplesmente uma mudança de base, e isso significa que podemos tomar uma 
equação quadrática qualquer, descrevê-la como matriz, e diagonalizá-la para obter uma equação na forma 
reduzida. 

Em toda forma quadrática podemos identificar eixos principais ortogonais. Quando a forma quadrática 
está na forma reduzida, os eixos principais serão colineares com a base canônica. Em outros casos, preci- 
samos realizar uma mudança de base para encontrar os eixos principais. Usando esta nova base, a forma 
quadrática pode ser descrita na forma reduzida. 

No resto desta seção trataremos tres casos diferentes: 


* A forma quadrática pode ter termos mistos, mas não tem componente linear (por exemplo, 2x? — 
2 
xy + 4). Neste caso conseguiremos transformá-la na forma reduzida >, ax? = c. 


* Há uma componente linear, mas ela podem ser eliminada por uma translação (por exemplo, x? — x), 
e também a levaremos à forma reduzida. 


* Há uma componente linear, e a forma não pode ser descrita sem ela - neste caso temos uma parábola 
ou parabolóide (por exemplo, 2x2 — y — 2). 


O teorema que nos garante que podemos eliminar os termos mistos encontrando os eixos principais é o 
Teorema dos Eixos Principais Podemos enunciá-lo de maneira bastante concisa, como a seguir. 
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Teorema 12.29. (dos eixos principais) Toda matriz simétrica real tem autovalores reais e uma base formada por 
autovetores ortonormais. 


No entanto, será mais interessante enunciá-lo listando também suas consequências. 


Teorema 12.30. (dos eixos principais) Seja A a matriz simétrica representando uma forma quadrática. Existe uma 
base na qual a mesma forma quadrática é descrita por uma matriz diagonal D, e a matriz P que realiza esta mudança 
de base é ortogonal. 

A mudança de variáveis que permite escrever a forma quadrática na forma reduzida é dada por P—!x, ou, uma 
vez que P é ortogonal, P! x. Após a mudança de base, a forma será descrita por 


MXF + Azx5 eo + Anxi 
onde os A; são os autovalores de A. 
Exemplo 12.31. Considere a equação quadrática 


4xy = 1 


—- [0 2 
E. 
Diagonalizamos a matriz, obtendo Q = PDP”, com os vetores de P ortonormais: 
1 
SVA S. o) p= EE 
( 0 2) v2 -1 1 


Observando os autovalores já sabemos que se trata de uma hipérbole. A matriz P™! = PT muda da nova 
base onde D descreve a hipérbole para a base original, portanto 


aG DG) =). 


e a mudança de base pode ser descrita pela troca de variáveis 


A matriz associada a esta equação é 


x +y’ 
p = 
v2 
=x +y’ 
NO VÃ 


Substituímos x e y na equação original, e obtemos 
2 PAM =, 


e observamos que obtivemos os autovalores de A como coeficientes, exatamente como nos garante o teo- 
rema dos eixos principais. 


Se observarmos a matriz de vetores ortonormais + 


v2 


ı G 
zZ Z\_ [csl 
— F 5 sen( 
e a mudança de base de uma hipérbole para outra é uma rotação por um ângulo 77/4, como mostram os 
gráficos das duas funções, a seguir. 


P, notaremos que 


) —sen( 
) cos( 


BIA BIA 
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o NY 


A primeira mostra 4xy = 1, e a segunda, 2y? — 2x? = 1. As linhas pontilhadas na prineira figura são os 
eixos principais, determinados pelos autovetores da matriz A. « 


A forma quadrática do exemplo anterior não tinha componentes lineares. Quando tivermos a compo- 
nente linear, 


i) Se a matriz A tiver inversa, então podemos calcular a constante Ab e realizamos a translação 
LA 
z=x+-Ā b 
2 
A forma quadrática passa a ser escrita então como 
1 
z AzZz=c+ qua, 
e uma vez que o lado direito é uma constante, podemos classificá-la e escrever sua equação como se 


não houvesse a parte linear. 


ii) Sea matriz A for singular, a forma é um parabolóide, e podemos apenas eliminar os termos mistos, 
mas os termos lineares permanecerão. 


faltam nesta subseção mais exemplos! 
Uma discussão em maior profundidade das superfícies definidas por formas quadráticas pode ser en- 


contrada no livro de Georgi Shilov [Shi77]. 


12.4.2 Classificação de equações diferenciais parciais [ formas definidas, 
eixos principais ] 


Uma equação diferencial parcial de segunda ordem com coeficientes constantes pode ser descritalf|por 
uma matriz A, um vetor b e uma constante p: 


2 QijUxix; + > big +pu=0 


ij i 


20u, mudando a notação, 


ij 


au ðu 
EF bu +pu=0. 
2 ai 3xiðxj z laa PM 


30u ainda, pode-se usar uma única matriz de ordem n + 1 (da mesma forma que fizemos na seção|12.4.1}). Nesta seção, no entanto, 
os termos lineares realmente não nos importam, portanto a representação por matriz de ordem n é mais interessante. 
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Exemplo 12.32. Se u é uma função de três variáveis, então a equação 
3usx + 2Uyy — Uyz — Uy —0 


é descrita por 


3 0 0 0 
A=0 2 1/2), b=[—1 < 
0 —1/2 0 0 
Exemplo 12.33. A equação 
du du du du 
| H +3 =0 
Ox? ðxðz ðyðz oz 
é descrita por 
1 0 1 0 
A=0 0 —-1/2], b=[0). « 
1 —1/2 0 3 


Desta forma, classificamos as equações diferenciais parciais como: 

* elíptica se A é positiva definida; 

* hiperbólica se À é indefinida, tendo um autovalor com sinal diferente dos outros; 

* ultrahiperbólica se À é indefinida, com ao menos dois autovalores positivos e dois negativos; 

e parabólica se A tem um autovalor zero. 

As características de cada um dos tipos de equações são completamente diferentes - elas representam 
fenômenos de diferentes naturezas, e os métodos de análise e solução para cada tipo são também total- 
mente diversos. 


Exemplo 12.34. O exemplo mais simples de equação parabólica é a equação do calor, 


u du ðu 
x2 


com A = diag(1, 1,0) e uma derivada de ordem um. Equações parabólicas surgem tipicamente na descri- 
ção de fenômenos de propagação (como o calor em material sólido, por exemplo). Estas equações também 
são chamadas de equações de difusão. 


O exemplo mais simples de equação elípticaé com A = T, b = 0, e z = 0 - a equação de Laplace: 
du A du du 
0x2 


É comum que a equação de Laplace (e das equações elípticas em geral) surja na modelagem de sistemas 
em equilíbrio. Por exemplo, um sistema onde a entrada e a saída de energia são em mesma quantidade, 


a dimensão do tempo pode ser desprezada, e temos então a equação do calor, sendo removido o último 
termo. 
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O exemplo mais simples de equação hiperbólica é com A = diag(1,1,...,1,—1) - a equação da onda: 
du du du 

dx? dy Ət? 

Equações hiperbólicas lineares descrevem fenômenos ondulatórios (uma corda vibrando ou a superfície de 
tambor, por exemplo). < 


A seguir temos o teorema dos eixos principais, aplicado às EDPs de segunda ordem. 


Teorema 12.35. Toda equação diferencial parcial de segunda ordem com coeficientes constantes envolvendo uma 
função de n variáveis pode ser reduzida, por uma transformação linear, a uma das seguintes formas: 


° elíptica: } ; Uxx; +... =0 
* hiperbólica: 5 usa — Uxx, +... =0 
* ultrahiperbólica: (Zi iia) — (PR f uxix) +... = 0 


; k 
* parabólica: _  juxx +... = O comk <n. 
onde os termos denotados por “. . .” são de ordem um ou zero. 


Os métodos usados para resolver cada tipo de EDP também são determinados pelo tipo da equação. 
Uma descrição destes métodos fica fora do escopo deste texto, mas o leitor pode consultar o livro de Walter 
Strauss e, para uma abordagem mais intuitiva e menos formal, o de Stanley Farlow [Fars2), além da 
bibliografia mencionada no Apêndice[6] 


12.4.3 Máximos e mínimos de funções em R” [ formas definidas | 


Uma combinação convexa de vetores (ou pontos) é semelhante a uma combinação linear, exceto que os 
coeficientes refletem uma escolha de frações de cada vetor, com a soma das frações igual à unidade. Por 
exemplo, 0.2 do vetor v1, 0.7 do vetor vz e 0.1 do vetor v3. 


Definição 12.36 (combinação convexa). Uma combinação convexa é uma combinação linear onde os coefi- 
cientes são positivos e somam 1. + 


Exemplo 12.37. A combinação 0.2xı +0.5x2 +0.3x3 é convexa, porque os coeficientes são todos positivos, 
e0.2+0.5+0.3=1. « 


Definição 12.38 (conjunto convexo). Seja A C R™. Se, para todos x,y € A, todas as combinações conve- 
xas de x e y pertencerem a À, então A é um conjunto convexo. + 


Exemplo 12.39. Em R?, os interiores de uma circunferência, elipse ou poliedro são conjuntos convexos. 
Já os conjuntos de pontos mostrados na figura a seguir não são convexos. 
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«4 


Exemplo 12.40. O conjunto de pontos no interior de um cubo ou elipsóide em R3? é convexo. 
Já os pontos dentro de um toro, por exemplo, não formam um conjunto convexo. 


«4 


+ 


Definição 12.41 (epigrafo). O epigrafo de uma função f : R” — R é o conjunto de pontos acima de seu 


gráfico: epi f = {(x,y) :x € R”,y E R, y > f(x)} 
Exemplo 12.42. A figura a seguir mostra o epigrafo da função f(x) = x? — 2x + 1. 


44 
3+ 
3 2 
wa 
1 
0 > 
0 1 2 3 4 
X 
« 


Exemplo 12.43. A figura a sguir mostra a função f(x,y) = E + 3y2. Seu epigrafo é toda a região acima 


da superfície mostrada. 
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Definição 12.44 (função convexa). Uma função é convexa se seu epigrafo é convexo. + 


Exemplo 12.45. Seja f(x) = ax? + bx + c uma função quadrática. Se a > 0, então f é convexa. Se a < 0, 
—f é convexa. Por exemplo, a função 4x? — 16x — 4, mostrada na figura, é convexa. 


N 


2x? 


JT t yŽ. É fácil perceber que 


Exemplo 12.46. A figura a sguir mostra a função não convexa f(x,y) = 
seu epigrafo não é convexo. 


Já a figura a seguir mostra a função f(x) = cos(x + 1)2, que também não é convexa. 
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< 
Definição 12.47 (ponto crítico). Seja f : R” — R. Um ponto crítico de f é um ponto x € R” tal que todas 
as derivadas parciais de f em x, se existirem, são iguais a zero. 4, 
Exemplo 12.48. Considere a função f(x) = cos(x + 1)2. O ponto x = —1 é um ponto crítico para f, já que 
d 
— f(x) = —2 cos(x + 1) sen(x + 1), 
dx 
e portanto 
d 
—f(-1) =0. 
dx A 
O mesmo acontece com x = (m — 2)/2 = 0.570796 .... A figura a seguir mostra os dois pontos críticos. 
2% 
1.5+ 
R 
q— 
x 
< 
Exemplo 12.49. Um parabolóide elíptico tem um único ponto crítico, no topo ou fundo. < 


Definição 12.50 (matriz Hessiana). Seja f : R” — R duas vezes diferenciável. A matriz Hessiana de f em 
x, denotada por H+(x) ou V? f(x) é a forma bilinear 
d?f(x) 


V a)i = AA 
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ou 
o2f o2f o2f 
02x1 (x) dx7 0x2 (x) 0x1 0xn (x) 
o2r o2f o2r 
V2f(x) = | dx20m (x) 32x; (5) 3x2 ðxn 1X , 
o2f : o2f ; a? f 
OXn 0x1 (x) Xn 0x2 (x) Rr 02xn (x) 


Exemplo 12.51. Seja f : R? — R3, tal que 


f(x,y,z) = xy +77. 


010 
1 0 0j. < 
002 


g(x, Y, z) = xy?z? + cos(z). 


A Hessiana de f é 


Exemplo 12.52. Seja g : R? — R3, tal que 


A Hessiana de g é 


0 3y? 0 
3y? 6xy o 
0 0 2-—cos(z) 
Este exemplo mostra que a Hessiana é, na verdade, função de x, y e z. < 


Teorema 12.53. Uma função f : R” — R duas vezes diferenciável é convexa se e somente se sua Hessiana é 
semidefinida positiva. 


Corolário 12.54. Uma função f : R” — R duas vezes diferenciável é convexa se e somente se o lugar geométrico 
(conjunto de pontos) definidos pela sua Hessiana pode ser contido em uma região limitada de R”. 


Teorema 12.55. Seja x um ponto crítico de uma função f : R” — R, e H a Hessiana de f. Se H é semidefinida 
positiva, x é máximo local. Se H é semidefinida negativa, x é mínimo local. Se H é indefinida, então x é ponto de sela. 


Corolário 12.56. Seja f : R” — Rex um ponto crítico de f. Se a Hessiana de f é semidefinida positiva para todo 
ponto, então x é máximo global de f. 


12.4.4 Otimização quadrática 


Problemas de otimização pedem que seja encontrado um ponto no qual uma dada função qualquer tem 
valor ótimo (máximo ou mínimo), respeitando certas restrições. 

Um programa quadrático é um problema de otimização onde o objetivo é maximizar ou minimizar uma 
função quadrática, respeitando restrições descritas como desigualdades lineares. 


Definição 12.57. Um programa quadrático é definido como 


1 
min z(A,x) = Ac! x + 7x" Qx. 
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sa.:Ax<b 
x>0 


onde À é um parâmetro escalar; c e x são vetores com n elementos; e Q é uma matriz semidefinida positiva 
n x n; À uma matriz m x n; e b é um vetor com m elementos. + 


Q define uma forma quadrática; se não for semidefinida positiva, a função não será convexa. 


Exemplo 12.58. Um investidor quer montar uma carteira de ativos. Para cada par de ativos i e j, ele 
conhece as médias u; a variância o;; e a covariância gij. Ele quer construir uma carteira que lhe dê um 
rendimento médio mínimo r, minimizando o risco. 

A função a ser minimizada (o risco) é > , >. j CyjXiX;, uma função quadrática. E as restrições são: 


* Cada xi representa uma fração do valor total investido, e a soma das frações deve serum: 3) xı = 1. 


* O rendimento médio deve ser > r, ou seja, ) , pixi > T 
min J E OijXiXj 
i j 
s.a.: E x =1 
i 
ba HiXi >T 
i 


x>0 < 


Não tratamos aqui dos algoritmos para solução de programas quadráticos. Exposições detalhadas de 
programação linear e não-linear, incluindo programação quadrática, são dadas nos livros de Luenber- 


ger e de Nocedal [Nwo6]. 


Exercícios 


Ex. 270 — Determine as matrizes das formas bilineares: 


f(x,y) =xy — 2x + 3y 
g(x, x) =3x? + x 


Ex. 271 — Prove a proposição 
Ex. 272 — Prove o teoremaļ(12.13 
Ex. 273 — Prove o teorema[|12.19 


Ex. 274 — OTeoremal12.20jnos garante que para qualquer matriz quadrada A com valores positivos, temos 
det A < |] aii. Prove que o mesmo vale para o valor absoluto do determinante - ou seja, 


idet Al < HI Qiji. 
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Ex. 275 — Prove o teorema|/12.28 


Ex. 276 — Sejam A e B dois operadores definidos positivos em R”. Defina a relação A < B se e somente 
se (B — A) é positivo. Mostre que: 


i) < é transitiva. 
ii) Se A < BeX < Y, então A +B < X +Y. 
iii) Se X é invertível e A < B, então XAXT! < XBX-!. 
Ex. 277 — Mostre a representação matricial da função quadrática usada no exemplo([12.58] 


Ex. 278 — Descreva geometricamente as formas quadráticas com In(A) = (1,0,1) eIn(B) = (1,0,2). 


Ex. 279 — Na seção[12.4.1/exibimos a classificação das cônicas e quádricas com equações x! Ax +b = k, 
com k > 0, Descerva geometricamente os casos degenerados, onde k = 0. Para as cônicas, explique como 
esses casos degenerados são obtidos pela interseção de plano e cone. 


Ex. 280 — Classifique as seguintes funções quadráticas: 
Dx -xy +zy- & =5 
ii) x? +xy=1 
iii) xz +z% — x? =3 


iv) xy — xz + zy — x2 + 5 =l 


Ex. 281 — Mostre que nenhuma função polinomial com grau ímpar maior ou igual a 3 e em uma variável 
é convexa em R. 


Ex. 282 — Seja f(a, b) = e“ + log(b) é convexa em todo R?? E g(a, b) = e€ — log(b)? 
Ex. 283 — f(a, b) = log(a)b é convexa? 
Ex. 284 — Onde f(x) = x} /x2 é convexa? 


Ex. 285 — Seja R[x] o conjunto de todos os polinômios em x com coeficientes reais. Seja S o subconjunto 
de R[x] que são positivos no intervalo [0, 1]. Mostre que S é convexo. 


Ex. 286 — Escreva a forma quadrática em Z3 representada pela matriz a seguir. 


101 
001 
000 


Ex. 287 — Quantas formas quadráticas distintas existem em Z}? 
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Capítulo 13 


Geometrias: Afim e Projetiva 


Uma das maneiras de descrever a Álgebra Linear é como o estudo da geometria de várias dimensões. Até 
este ponto, tratamos da Geometria Euclidiana, mas há geometrias diferentes, que surgem quando não usa- 
mos os cinco postulados de Euclideg!| 


I um segmento de reta é determinado por dois pontos; 
Il qualquer segmento pode ser extendido em duas direções, dando origem a uma reta; 


HI um círculo pode ser descrito por um segmento de reta, tomando uma das extremidades como centro 
e o comprimento do segmento como raio; 


IV ângulos retos são congruentes; 


V dada uma reta r e um ponto P fora dela, há um único ponto que passa por P e nunca intercepta r. 


Neste Capítulo iniciamos uma exploração de duas geometrias. Primeiro, a Geometria Afim, que é uma 
descrição mais interessante da Geometria Euclidiana (nela ainda valem os postulados de Euclides); e depois, 
a Geometria Projetiva, onde o postulado V (das retas paralelas) já não vale, porque não há nesta geometria 
retas paralelas - todas as retas se encontram em algum ponto. 


13.1 Geometria Afim 


Nos interessam neste Capítulo algumas transformações que não estudamos anteriormente por não serem 
lineares, apesar de serem simples e importantes. Em particular, não pudemos, no Capítulo [3] tratar de 
translações, que são um tipo de isometria. 

Isometrias são movimentos rígidos, ou transformações que preservam as distancias entre pontos - 
por exemplo, translações são isometrias. Quando tratamos de transformações lineares, observamos que 
a translação não é linear. 

A Geometria Afim generaliza a Geometria Euclidiana separando pontos de vetores: os vetores não tem 
posição fixa no espaço (sua visualização “depende de um referencial”), e pontos são posições fixas (são 
“referenciais” qua podemos usar para visualizar vetores). 


10 quinto postulado na verdade foi descrito por Euclides de forma diferente, mas o enunciado que damos é equivalente a ele. 
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Um ponto pode ser descrito por um vetor e um referencial (o ponto que convencionamos chamar de 
“origem”). Se trocarmos o referencial, teremos realizado uma translação. Poderemos representar transla- 
ções naturalmente como matrizes, e consequentemente como transformações afim. Começamos, portanto, 
definindo isometrias. 


Definição 13.1 (isometria). Sejam V e W espaços vetoriais com produto interno. uma transformação 
T:V > W é uma isometria (ou movimento rígido) se, quando aplicada a um conjunto de vetores, preserva 
as distâncias entre eles, ou seja, para todos x e y em V, 


dv (x,y) = dw(T(x), T(y)), 
onde dw denota a distância no espaço W e dy denota a distância em V. $ 


Usualmente teremos V = W, e podemos dizer que f é isometria se para todos x,y € V, d(f(x), f(y)) = 
d(x,y). 


Exemplo 13.2. Rotações, reflexões e translações são isometrias. 
Refletir um conjunto de pontos por um hiperplano não muda as distâncias entre os pontos. Por exem- 
plo, considere a reflexão em R? pelo eixo das ordenadas, 


T[ (x15x2)" ] = (=x1, x2)". 


A figura a seguir mostra um exemplo da aplicação desta transformação em uma imagem. 


4 


Notamos na figura que a distância entre os pontos transformados não muda. Verificaremos agora algebri- 
camente que T preserva distâncias entre quaisquer dois pontos. Usamos a noção usual de distância para 
RŽ, já vista no Capítulo[7] Verificaremos que 


d| (x1,x5) (uy, y2)! ] = d[T(x1, x2)", T(y1,y2)"]. 


De fato, temos 


dl (xr,x2)", (y1, y2)" | =4/ (01, x2)", (un, 92)") 


= Vaza) (un ua)” 

= VX1Y1 + x2U2 

= y (—x1)(—y1) + x242 
= y (=x1,x2)"(—y1, y2)" 


= Va”, (—y1,y2)7) 
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= d[T(x1,x2)", T(y1,y2)"]. 
Pode-se facilmente verificar que o mesmo vale para traslações e rotações. < 


Exemplo 13.3. Mudança de escala e cisalhamento não são isometrias. 
Considere a transformação T(x1,x2)! = (2x1,x2/3)", que realiza mudança de escala nos dois eixos. 
A operação é ilustrada na figura a seguir. 


d[ T(x1,x2)", T(y1;y2)" ] = al (2x1,x2/3)", (2y1,y2/3)" ] 
V((2x1,x2/3)T, (2y1,y2/3)") 
= y/(2x1,x2/3)" (291, y2/3)T 


= y 4x1y1 + x2y2/9 
+ vVX1y1 + x2y2 
= d[(x oo, (y1 ,y2)"] . 
A mudança de escala claramente muda a distância entre pontos, a não ser no caso trivial onde o fator de 


escala é um. 
Facilmente podemos obter o mesmo resultado para a operação de cisalhamento, como pede o exercí- 


cio[289] < 


Nem toda transformação linear, no entanto, é uma isometria - basta considerar T (v) = 0, por exemplo. 


Teorema 13.4. Em R”, qualquer isometria T que preserve a origem, ou seja, tal que T(0) = 0, é uma rotação. 
Teorema 13.5. Se T é uma matriz de rotação, então det T = 1. 


A demonstração do teorema é simples pra R?: 


det T = det E O) = sen? 0 + cos? 0 = 1. 
sen O cos O 


O exercício [290]pede a demonstração para R”. 

As transformações lineares em R” não representam todas as isometrias, porque translações não são 
lineares. A geometria afim surge quando tentamos incluir as translações entre as transformações entre 
espaços vetoriais. 

As translações não são lineares porque as transformações lineares são da forma Ax, onde apenas tro- 
camos cada coordenada de x por uma combinação linear das dela com outras. Uma transformação linear 
não pode somar valores às coordenadas: de outra forma, teríamos T(0) Æ 0, por exemplo. 
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Isso está relacionado ao conceito de vetor: como vetores são independentes de origem (ou de “referen- 
cial”), não faz sentido transladá-los. Um vetor w transladado por um vetor v resultará nele mesmo, como 
mostra a figura a seguir (note que os dois vetores w na figura são idênticos, porque vetores independem de 
referencial - ou de “origem”). 


13.1.1 Espaço Afim 


A Geometria Afim resolve dois problemas que percebemos na Geometria Euclideana: primeiro, pontos e 
vetores não mais se confundem; e em segundo lugar (como consequência da separação de pontos e vetores), 
podemos representar translações como transformações afim, que definiremos mais adiante. 

Um espaço afim é uma representação de R”, sem dar à origem uma posição privilegiada, separando os 
conceitos de ponto e vetor. Tendo pontos e vetores como noções diferentes, podemos definir a operação de 
soma de ponto com vetor. Note que se somarmos o mesmo vetor a diferentes pontos, todos serão transladados 
pela mesma distância e na mesma direção. Esta é exatamente a operação de translação que queríamos. 


vV 
o oo 


P p+v 


Somando um ponto a um vetor, obtemos outro ponto. Naturalmente, queremos que esta operação obedeça 
algumas propriedades: 


i) deve valer a associatividade na soma de pontos com vetores: (p + v) +w = p + (v +w); 


p+ (v +w) 


p 


ii) o vetor 0 do espaço vetorial, quando somado a qualquer ponto p, resulta no próprio p; 
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iii) deve ser possível subtrair um ponto de outro, resultando em um único vetor - ou seja, para dois 
pontos quaisquer a e b, há um único v tal que a = b-+v ou, usando a notação de subtração, a—b = v. 


o—tso 


b a 


Como definimos apenas uma operação (a soma), não tratamos de distributividade. Formalizamos estas 
idéias na definição a seguir. 


Definição 13.6 (espaço afim). Um espaço afim sobre um corpo K é uma estrutura (V, P, +), sendo V um 
espaço vetorial sobre K e P um conjunto de pontos. A operação + obedece às seguintes propriedades: para 
todos os pontos a, b e vetores v, w, 


i) a+0= qa; 
ii) (a+v)+w=a+(v+w); 
iii) existe um único vetor u tal que b = a + u; denotamos este vetor por ab, ou por (b — a). + 


Veja que “herdamos” de V as operações de soma de vetores e de multiplicação de vetor por escalar. 
Além destas, definimos a operação de soma de ponto com vetor. 


Exemplo 13.7. Considere o par (P = R2, V = R?), onde chamamos os elementos em P de pontos e os 
elementos em V de vetores. Se usarmos nele a operação usual de soma de vetores, tanto para somar vetores 
como para somar pontos, temos um espaço afim. Da mesma forma, (R”, R”) também é. « 


Exemplo 13.8. Uma reta que não passa pela origem não é um espaço vetorial, mas podemos vê-la como 
espaço afim: tomamos os pontos de uma reta qualquer - por exemplo, a reta r dada por y = 2x + 1 (ou 
seja, para todo x real, (x,2x + 1) € r). Agora escolhemos o espaço vetorial R. Definimos a operação 
+:rxR > rda seguinte maneira: suponha que o vetor a ser adicionado seja o número real v. Então 
adicionamos o vetor à primeira coordenada (x), e determinamos a segunda. 


x + NE v) = (x +», 2(x+9) +1) 
= n 


ponto vetor 


A próxima figura ilustra a adição do vetor (+1.5) ao ponto (—1, —1). 


(0.5,2) 
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Como a reta dada é um conjunto de pontos e R é um espaço vetorial, nos falta apenas mostrar que a ope- 
ração de soma de ponto com vetor tem as propriedades descritas na definição 


i) Para qualquer ponto (x,y) da reta, trivialmente (x,y) + 0 = (x,y). 
ii) Seja a = (x,2x + 1) um ponto da reta r, e v, w dois números reais. Então 


la+v +w=l(x,2x+D+v+w 


=j 
= (x+ v,2(x+v)+1)+w 


( 
( 


x+v+w,2(x+v+w)+ 1) 
x+iv+ w], w(x +[v+w])+1) 
x, 2x + 1)+[v+w] 


=a+[Īv+w]. 


iii) Sejam a = (x,2x + 1) e b = (w,2w + 1) dois pontos da reta r. Então, se b = a + u, temos 


(w,2w +1) = (x,2x+1)+u 
(w,2w + 1) = (x+ u,2(x+u) +1), 


de onde percebemos que w = x +u, e portanto existe um único 


u= wsx. 


Agora podemos afirmar que (r, R, +) é um espaço afim. « 
Exemplo 13.9. A equação 
— +yº-z=0 


define um parabolóide hiperbólico (que tem um ponto de sela centrado na origem), que chamaremos de P. 
Note que podemos reescrever a equação: 


Zz=—x2 + y7. 


Os pontos deste objeto geométrico podem ser tratados como um espaço afim: usaremos P, o espaço vetorial 
R2, ea seguinte operação de soma de pontos com vetores: 


(x, y —2 6492) + (0,b) = (xa, x +b, lx+ a)? + (y +) 


Geometricamente, usamos o plano (x, y, 0) como “índice”, e realizamos ali a soma de vetores aos pontos; 
depois calculamos a altura do ponto que queremos. 
A operação de soma tem as propriedades necessárias para que (P, R?, +) seja um espaço afim. < 


Exemplo 13.10. Sabemos que o conjunto de soluções de um sistema linear homogêneo é um espaço vetorial. 
Já o conjunto de soluções de um sistema linear não homogêneo é um espaço afim. 

Seja A uma matriz m x n, e seja Ax = b um sistema não homogêneo, e Ax = 0 o sistema homgêneo 
associado. Observamos que b e 0 tem m linhas. 
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Denominamos o conjunto de soluções do sistema não homogeneo por B, e o espaço vetorial das soluções 
do sistema homogeneo por H: 


B=([x: Ax=b) 
H=[x: Ax=0} 


os elementos de B e H são vetores coluna com n linhas. 
Identificamos os elementos de B com pontos, e usamos H como espaço vetorial; nosso espaço afim será 
portanto (B, H), +, onde + é a soma usual de vetores. Sejam x,y € B. Então: 


i) Seja0O € Ho vetor zero (lembramos que 0 sempre é solução para o sistema homogeneo). Trivial- 
mente, x + 0 =x. 


ii) Sejam ab € H. Também é trivial que x + (a +b) = (x + a) + b, porque x, a e b são vetores em R”, 
e a adição de vetores é associativa. 


iii) Existe um único a € H tal que 


x=a+y. 
Certamente a existe e é único, porque é a soma de dois vetores, x e —y. Resta mostrar que a pertence 
aH. 
x=a+y 
Ax = Aa+y 
Ax— Ay = Aa 
b-—b = Aa, (Sex,y € B, então Ax = b, Ay = b) 
0 = Aa. 


E assim vemos que a é solução para o sistema homogeneo, e terminamos a demonstração: (B, H, +) 
é um espaço afim. « 


Exemplo 13.11. < 


13.1.2 Subespaço afim 


Definição 13.12 (subespaço afim). (S, W) é subespaço afim de (P, V) se S C Pe (S, W) é um espaço 


afim. 4 
Exemplo 13.13. Evidentemente, se (P, V) é espaço afim, então (P, V) é subespaço de si mesmo; e tanto 
(Lp) Ø) como (Ø, Ø) são subespaços de (P, V). < 
Exemplo 13.14. « 


Lema 13.15. Se (S, W) é subespaço afim de (P, V) então W é subespaço vetorial de V. 
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13.1.3 Dependencia afim, baricentros 


Ao estudar espaços vetoriais, definimos o conceito de combinação linear. Em espaços afim não as usamos, 
porque elas dependem de coordenadas dos vetores, que são sempre relativas a uma origem. Esclarecemos 
com um exemplo. 

Sejam P1 = (1,1) e P2 = (3,1) dois pontos no espaço afim (R2, R?). Queremos calcular a combinação 
linear 2P; + P>. Se computarmos simplesmente 2x coordenadas de Pı com coordenadas de P2, estaremos 
usando coordenadas relativas ao vetor zero - mas havíamos dito que o zero não tem papel privilegiado no 
espaço afim! Precisamos de um terceiro ponto como referência. 

Tomamos então duas outras referencias, Q = (1,0) e R = (3/2, —1/2), e observamos que 


20P, +3QP2 = 2(0,1) + (2,1) 2RP1 + 3RP> = 2(—1/2, 3/2) + (3/2,3/2) 
= (0,2) + (2,1) = o + (3/2, 3/2) 
= (6,3). = 5(1,9). 
ou seja, 
2QP1 + 3QP2 Æ 2RP1 + 3RP2. 


A combinação linear de pontos depende do referencial. A figura a seguir ilustra o que acabamos de calcular. 


11,9) = R' 


Para garantir que a combinação de pontos sempre será a mesma, sem depender da referência, basta 
exigir que a soma dos coeficientes seja um. 


Teorema 13.16. Sejam p1,..., pn pontos em um epsaço afim, e M, A2, .. ., An escalares cuja soma é um. Então 
para quaisquer dois pontos q, 1 no mesmo espaço, 


q+ x Agp =T + a Arp; 
i i 
Demonstração. Para quaisquer pontos q er, 


q+) Aqr=q+> Algr+rpi) 


13.1. GEOMETRIA AFIM 401 


=q+ px x) qr + ba Mrpi 


=q+qr + > rpi 
i 


= r + Àirpi. E 
Temos agora justificativa para definir o análogo de combinação linear para espaços afim. 


Definição 13.17 (combinação afim). Uma combinação afim ou baricentro dos vetores v1, V2, . . . , Vn é uma 
combinação linear destes vetores onde a somatória dos coeficientes é um, ou seja, uma combinação afim é 


) AjVi; 
$ 


com 


Žž asl. 4, 


Exemplo 13.18. Sejam 
Então 


é combinação afim de u, v e w, mas 


| E E nt ce 
6 A Taca va 


não é combinação afim de u, v e w, porque a somatória dos coeficientes não é um. < 


Exemplo 13.19. Os pontos p = (1,1),q = (1,3),r = (2,4) definem um triângulo. Podemos calcular 
vários baricentros desses pontos: 


s=>(1,1) (4,4) = (11,7) 


t= -(1,1) (4,4) = =(11,9) 


Ol= N| = 
WIN A|| = 
w= A= 


Note que podemos usar coeficientes negativos, e que isso significa que geometricamente, um baricentro 
pode estar “fora” da região delimitada pelo conjunto de pontog?} 

1 2 1 
E z> 1) = 6441) = 312,0) 


2Se exigirmos que os coeficientes sejam positivos, teremos uma combinação convexa. 


u = 3/2(1,1) 
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° 
q 
u 
° 
O ponto u ficou fora do triângulo porque foi calculado com coeficientes negativos. < 
Definição 13.20 (centróide). O centróide de um conjunto de pontos p1,p2,..., Pn é o baricentro desses 
pontos com coeficientes 1/n. + 


Exemplo 13.21. Os pontos (1,1), (1,3), (2,4) definem um triângulo, e calculamos diversos baricentros 
dele no exemplo[13.19] O centróide dos pontos, no entanto, é 


c= 9, DX 4(5,1) + 4(4,4) = (52). 


3 3 3 


W|— 


A próxima figura mostra o centróide. 


T 
c 
e \ 
° 
p q 

< 

13.1.4 Dependência afim, coordenadas e bases 
Definição 13.22 (dependência afim). Um conjunto de pontos p1, ..., Pn é afim-independente se para 
algum ponto pi, os vetores pip1, Pip2, - - - , PiPn são linearmente independentes. + 
Lema 13.23. Seja p1,..., Pn um conjunto de pontos. Se para algum dos pontos, pi, a família de vetores p;p; com 

j Æ i forem LI, então para todo i, a família de vetores pip; com j + i é LI. 
Teorema 13.24. Suponha que um vetor é o baricentro de p1,..., pn com coeficientes A1,..., An. Então esses 


coeficientes são únicos se e somente se os pontos p1, . . ., pn são afim-independentes. 
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Uma vez que um ponto é unicamente descrito pelos coeficientes de uma combinação afim, independete 
do ponto que usemos como referência, podemos usar estes coeficientes como coordenadas. No entanto, 
como percebemos anteriormente, as coordenadas são dependentes dos pontos usados para computar o 
baricentro. Precisamos de algo análogo ao conceito de base de um espaço vetorial. 

Construiremos então o conceito de base para espaços afim. 

Suponha que nosso espaço afim é (R2, R?). E, espaços vetoriais, nossas coordenadas eram com relação 
a uma base apenas. No espaço afim, como vetores não dependem da referencia fixa na origem, se quisermos 
um sisetma de coordenadas que nos permita descrever vetores e pontos, a intuição nos indica que uma 
“base” para este espaço deve incluir (i), um ponto de referência (que fará o papel da origem); e (ii), algo 
que se pareça com uma base para R?. Na figura a seguir, à esquerda, po é a origem, e bı, bz formam 
uma base para R?. Vale lembrar que os vetores foram dispostos partindo de po apenas por conveniência, 
porque eles não tem “posição fica” no espaço. Na figura da direita, vemos que ao invés de um ponto e dois 
vetores, podemos usar três pontos para descrever a base do espaço afim - e que, neste exemplo bı = ppp1 
eb; = popz- 


bı pı 


LAS k a 


Po Po 


Este raciocínio, generalizado para espaços vetoriais quaisquer, é condensado na definição|13.25 


Definição 13.25 (base afim). Seja (P, V) um espaço afim. Uma base afim para (P, V) com origem po consiste 
de um ponto po € P e uma base para o espaço vetorial V. 

Pode-se denotar a base por (po, b1, bz,..., bn), onde po é um ponto e os bi são vetores, ou por (po, 
P1,---» Pn ) onde po é a origem e os vetores da base de V são Pop1, Pop2, - --» PoPn- + 


Agora, com o conceito de base, já nos é possível definir coordenadas afim. 


Definição 13.26 (coordenadas baricêntricas). Seja B = (po, p1,..., Pn) uma base afim. Se um ponto p é 
baricentro de p1,..., Pn com origem po, e com coeficientes A1,..., An, denominamos esses coeficientes 
de coordenadas baricêntricas, ou coordenadas afim de p na base B. + 


13.1.5 Transformações Afim 


Trataremos agora de transformações afim. Além das transformações lineares, que já podemos realizar no 
espaço afim, podemos transladar pontos somando vetores a eles. 

Uma transformação afim é uma transformação dos pontos de um espaço afim os pontos de outro - ou seja, 
se os espaços são (P, V) e (P, V’), uma transformação afim terá P como domínio e P’ como contradomínio. 
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A transformação T : P — P’, de pontos em pontos, define uma outra transformação de vetores em vetores: 
se 


Então definimos uma transformação S em V, tal que 
S(b-a)=T(b)-T(a) 
Para que T seja afim, S deve ser linear. 


Definição 13.27 (transformação afim). Sejam (P, V) e (Q, W) dois espaços afim. Uma função T : P > Q 
é uma transformação afim se é linear em vetores, ou seja, a transformação S : V — W, tal que S(b — a) = 
T(b) — T(a) é linear. + 


O exercício|297|pede a demonstração do teorema[13.29 


Teorema 13.28. Sejam A = (V, P)e B = (W, P) dois espaços afim. Uma função T : A — B éuma transformação 
afim se e somente se preserva baricentros, ou seja, 


T(N pi +A2p2 + + Akpk) = A T(pi) +A2T(p2) +: +AkT(pk), 
para qualquer inteiro k > O e escalares A; tais que }_; N = 1. 
Exemplo 13.29. Considere o espaço afim (R?, R2). A transformação dada por 
f[ (x,y)! ] =Qos y + 2)" 
é uma translação. Verificamos que é uma transformação afim. Mostramos apenas o caso com dois pontos; 
o caso geral pode ser verificado semelhantemente por indução. 
af[ (p, q)" ] + bff (xy) ] = a(p,q+ 2)" +b(x,y + 2 
= (ap, aq + 2a)" + (bx, by + 2b)" 
= (ap + bx, aq +by + 2a + 2b)! 


= (ap + bx, aq + by + 2)! (a+b=1) 
= f| (ap + bx, aq + by)" ] 
= f| a(p,q)" +b(x,y)" ]. « 


Exemplo 13.30. A transformação dada por 
f[ (x, uy)! ] (—y, 2x) 
é linear, e deve portanto ser afim. Verificamos: 


af| (p, q)" ] + br[ (e y)” ] = a(—q,2p)" T b(—y, 2x)! 


[ (ap + bx, aq + by)" ] 
| a(p,q)" +b(x,y)" ]. < 
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13.1.6 Coordenadas afim e matrizes 


Queremos poder representar nossas transformações como matrizes, mas enquanto as transformações li- 
neares operam como multiplicação por matriz (Tx = y), transformações afim tem uma parte aditiva 
(Tx +z = y). É possível, no entanto, mudar nossa representação de forma que todas as transformações 
operam da mesma forma, como multiplicação de matrizes. 

Suponha que nosso espaço afim seja (R?, R?). Visualizaremos RŽ como subconjunto de R?: considere 
o plano onde z = 1, ilustrado na figura: 


zZ 


e 


” me 


£ y 


As transformações lineares em R? que levam pontos deste plano nele mesmo são da forma 


q1 2 P 
a21 A22 q 
0 01 


Estas transformações são lineares em Rĉ?, mas podem transladar pontos dentro deste plano! 


Exemplo 13.31. Considere por exemplo a transformação 
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A idéia que expusemos, da representação do espaço afim (R2, R?) como um plano em Rº, pode ser 
extendida para dimensões mais altas. De maneira geral, o espaço afim (R”, R”) e suas transformações 
afim podem ser descritos como um hiperplano de dimensão n em R"'*1, e transformações lineares que 
agem somente naquele hiperplano. 

De maneira geral, uma transformação afim em espaço afim de dimensão n pode ser descrita por uma 
matriz quadrada de ordem n + 1. 


Teorema 13.32. Toda transformação afim f pode ser descrita em forma matricial como 
f(v) = Av +w, 
onde A é uma matriz quadrada e w é um vetor. 
Além disso, toda função da forma f(v) = Av + w define uma única transformação afim. 
Suponha que tenhamos uma transformação afim Tv + w. Se reescrevermos o vetor v como 
v’ = (v1, V2, -.-,Vn30)', 


a translação w como 


w = (W1, W25... Wn, DE, 


podemos reescrever atransformação como 


Q11 Q12 > din WI 
a21 Q22 An w2 
A=|: 
an1 An2 Ann Wn 
0 0 0 1 
e teremos 
Av’ = Tv +w. 


Com o acréscimo de uma linha e uma coluna representamos transformações afim como uma única matriz. 
Uma transformação afim é composta de uma parte linear e uma translação (a parte afim). Na repre- 
sentação matricial, as primeiras n linhas e colunas da matriz são a parte linear, e a n — 1-ésima coluna 

representa a translação. 
L 


R Es 


1 2 
T=lo 1 3 
001 


realiza uma translação equivalente à adição do vetor (2, 3)". De fato, se x é representado usando coorde- 
nadas homogêneas, e portanto x = (x1,x2,1)!, então 


1 0 À da 
Tx=|013]Ix 
001 1 


Exemplo 13.33. A transformação 


O.O 
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X1 T 2 
=|x+3 < 
1 
Exemplo 13.34. Uma transformação estritamente linear (sem translação) terá A = 0. Por exemplo, 


cosð® —senð O 
R= | seng cosð O 
0 01 


é uma rotação por um ângulo 9, representada como transformação no espaço afim. Temos A igual ao vetor 
zero, e L igual à matriz da transformação linear que efetua rotação por 8. < 


Exemplo 13.35. Uma translação pura terá L igual à identidade, e em A teremos o vetor usado para trans- 
ladar os pontos. Por exemplo, 


é uma translação que adiciona 2 à primeira coordenada e 5 à segunda. < 


Exemplo 13.36. A combinação dos dois exemplos anteriores é uma rotação seguida de uma translação, 
representada por 


cosð® —senð 2 
T=SoR=SR= | sen0 cos0 5)- 
0 01 


Se calcularmos R o S, imediatamente percebemos que rotação e translação não são, de forma geral, comu- 
tativas: 


sen O cos0 2sinB+5cos0 


(no — sen ð asmo +5080) 
0 0 1 


«4 


O teoremal13.38/nos garante que a composição de duas transformações afim sempre será também outra 
transformação afim. 


Teorema 13.37. A composição de duas transformações afim é uma transformação afim. 


Demonstração. Sejam f e g duas transformações afim: 


f(x) = Ax+w 
g(x) = Bx + u. 


A composta f o g é 


(fog)(x) = A[g(x)] +w 
= A[Bx+u] +W 
= ABx + (Au + w), 


que é afim. [5 
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Da demonstração do teorema/13.38|também observamos que transformações afim não são sempre co- 

mutativas, já que ABx pode ser diferente de BAx. 

Teorema 13.38. A inversa de uma transformação afim, se existir, também será uma transformação afim. 


Demonstração. Uma transformação afim pode se escrita como f(x) = Ax + w. Sua inversa, quando existir, 
será 


f! (u) = A7! (u— w) 
=A lg A`'w. 


que claramente também é uma transformação afim. E 


13.1.7 ? 


Na figura a seguir, as setas indicam dois vetores que poderiam gerar este plano. 


zZ 


X y 


No entanto, as setas não são os pı € pz, que são pontos! Os vetores que servem de base para o subespaço de 
dimensão dois (o plano) são (pı — po) e (p2 — po). 
Para descrever completamente este espaço afim, precisamos de 


i) um ponto, que servirá de referência para a descrição dos outros pontos; 
ii) uma base para o subespaço onde nossos pontos e vetores estarão. 


Assim, para formar uma base para um espaço afim precisamos de n + 1 pontos, cujas coordenadas podem 
também representar vetores LIR”™+!, Agora definimos o conceito de dependencia afim, para determinar exa- 
tamente que propriedade esses n + 1 vetores devem ter. 


Teorema 13.39. Seja (+o,V1,...,Vn) base para um espaço afim A, e T uma transformação afim de A em A. 
Então a transformação T é unicamente e completamente caracterizada por T (v1), .. ., T(vn). 


Demonstração. Uma transformação no epsaço afim (R”, R” ) é descrita como um operador linear em R"+1, 
Este, por sua vez, é caracterizado por n + 1 valores em uma base. A base do espaço afim tem exatamente 
n + 1 vetores, então basta descrever a transformação linear em R”! E 


Exemplo 13.40. Seja B = ((0,0,1),(1,0,1), (0,1,1)) uma base para o espaço afim (R?,R?), e T uma 
transformação nesse espaço tal que 
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T(0,1,1)' = (2,4,1)" 
Como todo vetor é combinação linear da base, então 
(x,y,z) E a(0,0,1) +b(1,0,1) +c(0,1,1). 
com 
a=2z—UY—x 
b=x 
c=y 
Então 
T(x,y,z) E T(a(0,0, 1) +b(1,0, 1) pr c(0, 1,1)) 
= aT(0,0,1)+bT(1,0,1)+cT(0,1,1) 
= a(1,2,1) + b(0, 1,1) + c(2,4,1) 


= (z — y — x;2z — 2y — 2x,z — y — x) + (0,x,x) + (2y, 4y, y) 
= (—x + Yaz, —¥ + 2y + 2z, z). 


Como z = 1, 
T(x, y, 1)! = (—x +y + 1,—x + 2y + 2,1)" 


A matriz da transformação é 


Percebemos que a translação associada a esta transformação é dada pelo vetor (1,2)!, que aparece na 
última coluna da matriz. Isto está de acordo com os valores dados inicialmente para a transformação: 
T(0,0,1)" = (1,2,1)". «4 


Exemplo 13.41. Seja B = ((1,1,1),(1,0,1),(0,1,1)) uma base para o espaço afim (R2, R2), e T uma 
transformação nesse espaço tal que 


T(1,1,1) = (1,0,1) 
T(1,0,1) = (0,2,1) 
T(0,1,1) =(3,3,1) 


Como todo vetor é combinação linear da base, então 
(x,y,z) E a(l, 1, 1) +b(1,0, 1) + c(0, 1, 1). 
Disso obtemos 


a=x+y—z 
b=-y+z 


c=-x+2z 
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Agora podemos determinar T: 


T(x,y,2) = T(a(1,1,) + b(1,0,1) + c(0,1,1)) 
=aT(1,1,1)+bT(1,0,1)+cT(0,1,1) 
a(1,0,1) + b(0,2,1) + c(3,3,1) 
= (x+y —z)(1,0,1) + (—y + z)(0,2,1) + (—x + z)(3,3,1) 
x+y- z, 0,z +y -— z) + (0, —2y + 2z, —y + z) + (—3x + 3z, —3x + 3z, —x + zZ) 
—2x + y + 2z, —3x — 2y + 5z, Z). 


=( 
=( 


Observamos que, como esperado, o último componente é simplesmente z. Como z sepre é um, temos 


T(x, y, 1)" = (—2x +y + 2,—3x — 2y +5,1)". 


A matriz desta transformação é 


13.2 Geometria Projetiva 


(Esta seção é somente um rascunho!) 
Iniciamos esta seção com uma descrição intuitiva do que é a Geometria Projetiva, para posteriormente 
formalizarmos os conceitos de plano projetivo e transformação projetiva. 


13.2.1 Noções intuitivas 


Exemplo 13.42. Na figura a seguir temos, à esquerda, uma representação de uma linha férrea. À direita, 
a mesma linha férrea desenhada em perspectiva, de forma que os trilhos, que são paralelos, encontram-se 
em um ponto que supomos estar “no infinito”, e os dormentes são desenhados cada vez menores à medida 
que ficam mais distantes do observador. 


< 


A Geometria Projetiva nos permite obter uma imagem em perspectiva, de forma que, por exemplo, duas 
retas paralelas se encontrem “no infinito”. 
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Definição 13.43 (plano do objeto, da imagem e linha de terra). O plano 7x, que vemos na horizontal na 
figura, é chamado de plano do objeto, e o plano 7m, que está na vertical, é o plano da imagem. A linha Tto N 71, 
formada pela interseção entre os dois planos, é chamada de “linha de Terra”. é 


No plano do objeto, temos os objetos desenhados sem projeção (ou seja, sem o uso de “perspectiva”). 
No plano da imagem, temos uma projeção dos objetos, de forma que apareçam “em perspectiva”. 


Os pontos do plano do objeto são projetados no plano da imagem. A fim de definir como se dá a projeção 
dos pontos, definimos inicialmente um ponto O, que chamamos de centro da perspectiva. 


Definição 13.44 (linha de projeção). Para cada ponto P em no, traçamos uma reta r passando por P e por 
O. Esta reta passará pelo plano 7 (a não ser que seja paralela a ele - não tratermos deste caos agora), e o 
ponto por onde ela passar, 14 N r, é a linha de projeção de P em mi. + 


Definição 13.45 (linha de fuga, ponto de fuga principal). Se traçarmos um plano q perpendicular a mı e 
passando por O, a interseção q N mı deste novo plano com o plano da imagem pi; será uma reta chamada 
de linha de fuga, ou linha do horizonte. 


Se traçarmos uma reta s perpendicular a 711 e passando por O, a interseção s N 7 desta reta com o 
plano da imagem nı será um ponto, chamado de ponto de fuga principal. + 


Mudar a posição do ponto de perspectiva O é como mudar a posição do observador (ou da câmera). 


A figura a seguir mostra tres retas paralelas no plano do objeto projetadas no plano da imagem. 
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13.2.2 Coordenadas Homogeneas 


13.2.3 Transformações Projetivas 


13.3 Aplicações 
Leitura Adicional 


O leitor encontrará mais informações sobre as Geometrias Afim e Projetiva nos livros de Gallier [Galo1], de 


Coxeter [Cox08] e de Samule e Levy [SL88]. Os livros de Kostrikin [KM89] e de Shafarevich e Remizov |SR09 


também apresentam as Geometrias Afim e Projetiva. O livro de Gomes e Velho [GV08] aborda a aplicação 
em Computação Gráfica. 
Outra abordagem para geometria que pode ser útil é a Álgebra Geométrica, descrita nos livros de Emil 


Artin [Art88], Alan MacDonald [Mac11] e de Dorst, Fontijne e Mann [DFMOo7]. 


Exercícios 


Ex. 288 — No exemplo mostramos que a reflexão por um dos eixos é uma isometria. Mostre que as 
reflexões por quaisquer retas que contenham a origem são também isometrias. 


Ex. 289 — Nos exemplos e[13.3/mencionamos que rotações e translações são isometrias, e que cisa- 
lhamento não é isometria, mas não demos demonstração disso. Elabore as demonstrações. 


Ex. 290 — Prove o Teorema/[13.5] 
Ex. 291 — Prove que em um espaço afim, para todos os pontos p, q, 
Dp-p=0 
ii) (q =p) = Ap — q) 
iii) p = q see somente se (p — q) = 0 
Ex. 292 — No Capítuld1] vimos que os conjuntos de soluções (i) de um sistema linear homogeneo; e (ii) 
de uma EDO linear homogênea são espaços vetoriais. No presente Capítulo, no exemplo|13.10| provamos 


que as soluções para um sistema linear não homogêneo formam um espaço afim. Ë natural perguntar se o 
conjunto de soluções para uma EDO linear não homogenea é um espaço afim. Prove que sim ou que não. 


Ex. 293 — Seja PP o conjunto de todos os polinômios cuja soma dos expoentes seja par, e Pİ aqueles com 
soma de expoentes ímpar. Prove que (P*, Pº, +) é um espaço afim. 


Ex. 294 — A transformação fl(x,y)!] = (1,1) é afim? Mostre que sim ou que não. 
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Ex. 295 — Prove que transformações afim preservam 
i) planos (planos são levados em planos); 
ii) paralelismo entre retas e entre planos; 


iii) razão entre volumes de paralelepípedos contidos em outros paralelepípedos: se um paralelepípedo 
A está contido em B, entao vol A/ vol B é iguala vol f(A)/volf(B). 


iv) o mesmo que pede o item (iii), mas para triângulos. 
Ex. 296 — Prove que, dados dois triângulos quaisquer A e B em R?, existe uma transformação afim que 
leva A em B (e consequentemente, transformações afim não preservam ângulos). 
Ex. 297 — Prove o teorema/13.29 
Ex. 298 — Descreva algebricamente a transformação T no espaço afim (Rê, R3), com 


T(1,0,0,1) = (1,1,1,1) 
T(0, 1,0,1) = (0,1,1,1) 
T(0,0,1,1) = (0,0,3,1) 
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Capítulo 14 


Série de Fourier 


Em espaços vetoriais de dimensão finita sabemos como descrever vetores como combinação linear de al- 
guma base daquele espaço. Como todo espaço de dimensão finita é isomorfo a R” e conhecemos bases 
para R”, sempre temos como determinar uma base para estes espaços. No entanto, apresentamos no 
exemplo[2.35/o espaço de polinômios em R, com a base infinita 1,x,x2, x?,.... Claramente, estes polinô- 
mios geram todos os polinômios em R”, Neste capítulo mostraremos que há espaços de funções para os 
quais podemos determinar bases, compostas de infinitas senóides e cossenóides, e usamos estas bases para 
descrever certas funções periódicas como combinações lineares infinitas. 


14.1 Funções Periódicas 


Definição 14.1 (Função periódica). Uma função f com domínio D é periódica com período T se existe T € D 
tal que f(x) = f(x + T). O menor T positivo tal que esta equação é satisfeita é chamado de período mínimo 
de f. 

A frequência de f é o inverso de seu período: p = T7! 

A frequência angular de f é 


o = 2mgp = 57 + 


Suponha que o domínio de uma função periódica f seja o tempo. Enquanto o período é a quantidade de 
tempo necessária para que o valor da função se repita, a frequência é a quantidade de vezes que os valores 
se repetem em uma unidade de tempo. Muitas vezes os fenômenos periódicos estão associados a ângulos 
em uma circunferencia. Neste caso é mais conveniente usar a frequência angular, que é a quantidade de 
vezes em que os valores da função se repetem no decorrer de uma volta completa na circunferência. 


Exemplo 14.2. O período das funções seno e cosseno é 27, e suas frequências angulares são (27/27) = 1. 
O período da função tangente é n, e sua frequência angular é 1/2. < 


Exemplo 14.3. Mostramos a seguir o gráfico da função f(x) = (—1)!*, onde |x] é o inteiro mais próximo 
dex. 
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O período de f é 2 (tome por exemplo o intervalo (0.5, 2.5]). A frequência de f é 1/2, e a frequência angular 
é 27. < 


Exemplo 14.4. Há um exemplo muito simples, mas extremamente importante: seja f(x) = k uma função 
constante. A função f é periódica, mas não podemos identificar seu período, porque f(x) = f(x +T) =k 


para todo T. « 
Teorema 14.5. Se fj,...,fn são funções periódicas definidas no mesmo domínio D, com o mesmo período, e 
d1,..., An constantes em D, a combinação linear 


ha) =} axfi(x) 
i=1 


é periódica, e seu período é o mesmo das fi. 
Teorema 14.6. Se f é periódica com período T, e a Æ 0, então f(ax) é periódica com período T/a. 


Teorema 14.7. Sejam f1, ... são funções periódicas definidas no mesmo domínio D, com o mesmo período T, e 
a1, a2... € D, Seja h(x) definida pela série infinita 


h(x) = 2 aifi(x). 
i=1 


Então, para os valores de x para os quais a série converge, h(x) é periódica, e seu período é o mesmo das fi, ou seja, 
h(x) = h(x +T), 
onde T é o período das fi. 


Se f não é periódica, podemos tomar seus valores em um intervalo (a, b], e “repetí-los” no resto do 
domínio da função. À função resultante damos o nome de extensão periódica de f. 


Definição 14.8 (extensão periódica). Seja f uma função. A extensão periódica de f em um intervalo (a, b] é 
uma função periódica g que tal que g(x) = f(x) quando x € (a, b], com período b — a. + 


Exemplo 14.9. A função f(x) = x não é periódica. Sua extensão periódica no intervalo (—1, +1] é mos- 
trada na figura a seguir. 
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Esta função é dada por 


Exemplo 14.10. A extensão periódica de x? no intervalo [0, 2] é ilustrada na figura a seguir. 


2 


Observe que em [0, 2] a função é idêntica a x4, e nos outros períodos o comportamento se repete. 


-E : 


Deve ficar clara a diferença entre a descrição de uma função no domínio do tempo e sua descrição no 
domínio da frequência. 


Esta função é dada por 


A seguir mostramos os gráficos das funções g(x) = 4 cos(272x + 1) e h(x) = cos(2718x + 1). 
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o 


AA 


A primeira forma de onda tem frequência p = 2, amplitude A = 4 e deslocamento de fase f = 1. A 
segunda tem frequência pọ = 8, amplitude A = 1. 


Temos agora duas funções somadas, ou duas formas de onda sobrepostas. Tendo já fixado a forma A cos(21px+ 


f), com f = 1, podemos representar esta forma de onda como uma função cujo domínio são as frequências 
e cujo contradomínio são as amplitudes: 


Desta forma descrevemos a função no domínio da frequência. 
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Podemos também somar infinitas formas de onda - onde “somar infinitas funções” significa especificar 


uma série. 
Por exemplo, considere a forma de onda 


gn(x) = an cos(27wn (x) + f), 


com 
4 
dn = na 
wn(x) = (Qn + Tx 
T 


Podemos somarmos infinitos termos como este, 


G(x) = g1 (x) + ga(x) +=. 


Note que x é um parâmetro, enquanto o n nas equações|14.1/e/14.2]é o índice do termo gn: 


gn(x) = an cos(27wn (x) +f) 


= a cos (2m(2n + Dx — =) 


(2n +1) 


A função que acabamos de definir, G(x), é dada portanto pela série 


— 4 
= 3. Rara (2n2n+ 1x — 5 


n=1 


Esta série, que é a soma de infinitas formas de onda, converge para a função 


f(x) = E se x < |x + 1/2] 
+1 sex> |x+ 1/2]. 


(14.1) 


(14.2) 


(14.3) 


(14.4) 


(14.5) 
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Os gráficos a seguir mostram somatórios dos primeiros 1, 2, 20, e 80 termos da série mostrada na fór- 


mula[14.4] e a função dada na equação[14.5] 


—— primeiro termo — 2 primeiros termos 
T T T T 
1 E a m 
| A AA | 
0.5 F 1 05! | 
OF J OF 1 
0.5L | BOB - + 
a R | 
=i C D Wo Y 
L jl L L L L 
—0.5 0 0.5 —0.5 0 0.5 
—— 20 primeiros termos — 80 primeiros termos 
T 
1+ Y + Y = 1+ a p + 
dE ao dl al 
2 2 
md e J —ħ 3 
2 2 
-A | N A A A >A nm 4 Y 
$ L l i 
—I I -I 1 
2 2 2 2 


A série[14.4/é chamada de série de Fourier da função 


14.2 Série de Fourier 


Conhecendo as propriedades de combinações lineares de funções periódicas, podemos definir a série de 
Fourier, que descreve uma combinação linear infinita de funções de mesmo período. Lembramos que uma 
série apenas define um somatório, que pode ou não convergir. 


Definição 14.11 (Série de Fourier). A série 
Do 
ao 2nax 2nNTnX 
Pe dancos ( 7 ) + bn sen ( T ) 
n= 


é composta de termos periódicos com o mesmo período T. Tomamos os valores de x para os quais a série 
converge, definimos uma função f(x) com esses valores como domínio, e dizemos que esta é a série de Fourier 
para f. 

Os coeficientes ai, bi da combinação linear são chamados de coeficientes de Fourier. + 


Usando frequência angular ao invés de período, a série de Fourier para f é 


f(x) ~ S + 2 an cos (nwx) + bn sen (nwx). 


n=1 
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O símbolo ~ significa que o lado direito é somente uma expansão formal (ou simbólica). Não usamos o símbolo 
= porque não podemos garantir que a série converge em todos os casos. 
Os lemas a seguir são úteis na solução de equações diferenciais. 


Lema 14.12. Se f(x) é periódica com período T, sua derivada também tem período T. 


Lema 14.13. Se f(x) é periódica e tem expansão de Fourier complexa 


então 


14.3 Determinação de coeficientes 


Evitaremos por ora determinar quais funções periódicas podem ser representadas por séries de Fourier, e 
abordaremos o problema de, dada uma função f com período T, determinar os coeficientes de Fourier para 
f. 

A série de Fourier de uma função descreve a função como combinação linear de infinitas formas de 
onda. Estas infinitas formas de onda são uma base para um determinado espaço de funções. Usamos aqui 
uma analogia que poderá ajudar a compreender como obteremos os coeficientes da série de Fourier de uma 
função. Os componentes de um vetor em R? são determinados por suas projeções ortogonais na base. 


j y 


Por exemplo, se usarmos a base canônica (ey, ez, e3) e soubermos os ângulos entre v e os vetores da base, 
além da magnitude de v, teremos 

(ey,v) =x = Ivlcos œ 

(ez,v) =y = Ivllcos B 

(es,v) =z = Ijvllcosy 


Usaremos a mesema idéia para determinar os coeficientes de Fourier. No entanto, sabemos que o espaço 
das funções periódicas tem dimensão infinita, e que não tem, portanto, uma base finita. Já mostramos no 


422 CAPÍTULO 14. SÉRIE DE FOURIER 


exemplo que seno e cosseno são ortogonais no intervalo [—7, n]. O lema[14.14|mostra como obter 
infinitas funções ortogonais (e portanto LI) entre si. Estas funções são da forma cos ERT) e sen (ai, 
com n inteiro. Da mesma forma que descrevemos vetores em espaços de dimensão finita por combinações 


lineares, também usaremos combinações lineares destas funções para representar funções periódicas. 


Lema 14.14. Usando o produto interno usual para funções[!] em um intervalo fixo [a, b]; e para quaisquer m, n 


inteiros positivos, 
2max 2nnx “Jo sem tn 
(cos ( T ) ese ( T ) A Ap sem=n 


2max 2nnx “Jo sem tn 
(sen (ÉH) sen ( T Y=., sem=n 
EUV 


A demonstração do lemaf14.14]é um exercício simples de Cálculo. Este lema nos diz que seno e cosseno 
são ortogonais (isto é semelhante a (e1, e2) = 0 em R3), e que as senóides sen(n7x/T) tem norma ,/T/2 
(isto é semelhante a |le, ||? = (e1,e1) = 1 em Rº), assim como as cossenóides. 

Observe que se T = 2, a norma de cada uma das funções é 1, e portanto temos uma família ortonormal de 
funçõeg?] quando T Æ 2, temos uma família ortogonal. Uma família ortogonal é necessariamente composta 


de funções LI (pelo teoremal7.48). 


Lema 14.15. Seja f periódica com período T. Então para todos a e b, 


a+T b+T 
| f(x)dx = | f(x) dx 
a b 


A intuição nos diz que o lemaf[i4.15vale; as figuras a seguir mostram gráficos de cos(x). Na primeira, 
é ilustrada a integral em [—7, +7]; na segunda, a integral de [1/2,1/2 + 27]. O exercício|[300|pede uma 
demonstração rigorosa deste lema. 


Enunciamos agora o teorema que nos dá os coeficientes de Fourier de uma função. 


Teorema 14.16 (Fórmulas de Euler-Fourier). Seja f uma função com período T e frequência fundamental w. Os 
coeficientes de Fourier tais que 
a [0.0] 
0 
f(x) ~ 2 + J an cos (nwx) + bn sen (nwx) 


n=1 


10 produto interno de funções contínuas foi definido no exemplof7.6] páginaļ7.6] 
2Famílias ortogonais de funções também são chamadas de sistemas ortogonais. 
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são 


T 
bn + f(x) sen(nwx) dx 
0 


Demonstração. (i) Para ao: integramos os dois lados da equação em [0, T]: 


T T/a E 
| f(x) dx -| (x + D an cos (nwx) + bn sen no) dx 
0 0 


n=1 
aoT 
EE 


e portanto ao = E fo f(x)dx. 
(ii) Para an: multiplicamos os dois lados por cos(mwx) eintegramos em [0, T]: 


T T 
| f(x) cos(mwx) dx =| L o EN 
0 0 2 
E T T 
Sia >) ( an cos (nwx) cos (mwx)dx + | 
n=1 o 


bn sen (nwx) cos (mja) 
0 


Pelo lema/14.14| a última integral desta fórmula é zero, e 


T T 
| f(x) cos(muwx) dx = | Se ge ne] 
0 0 


dx 4 >| an cos (nwx) cos (mwx) dx 


n=10 


Novamente usando o lema[14.14| a integral dentro do somatório é nula quando m £ n e T/2 quando 
m =n. Usamos então m = n e obtemos 


M 
| f(x) cos(nwx)dx = io [senna] + Sol 


o 2nw 
T 
= (sen(nwT) — sen(0)) + ni 
2nw 2 
anl 
RN 


(iii) Para bn: usamos raciocínio análogo a (ii), multiplicando por sen(muwx), obtendo bn = Z fo f(x) sen(nwx) dx. 
E 


Exemplo 14.17. Sejam g(x) = x, e f(x) a expansão periódica de g para o intervalo (—1, 1]. 
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Calcularemos os coeficientes de f no intervalo (—1, +1]. 


Precisamos da integral de g em um domínio de tamanho 2. Como sabemos que g é definida em fun- 
ção de f, usaremos f. No entanto, não podemos integrar f no intervalo (0, 2] porque este intervalo não 
corresponde ao domínio fundamental que se repete para compor a função g. Tomamos o intervalo (—1, 1]. 


fo) 
le} 
Il 


1 
| xdx = 0 
—1 


o 
3 
II 


1 
| x cos(nx7)dx = 0 
— 


1 
2 
Ro =| x sen(nxm)dx = entro egim) 
— 


n?n? mn 
Todos os an são zero. Como n é inteiro, sen(n7r) = 0 e cos(nr) = —1"™. Com isto podemos descrever os 
coeficientes bn de maneira mais simples: 
2(—1)" 
p= 49 
Tm 
A série de Fourier para f(x) é 
00 
2(—1)” 
x= > — = sen(nx7) 
n=1 
2 
a sen(nx) — — sen(271x) + — sen(371x) — sen(471x) + -- 


Os gráficos das expansões de Fourier com n até 2, 4, 6 e 8 são mostrados a seguir. 
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«4 


Exemplo 14.18. Consideramos novamente f(x) = x, mas desta vez no intervalo |—7, n] (e consequente- 
mente com período 27). Temos 


1 TE 
ao =] xdx = 0 
-m 


T 
1 (7 1 z 

Qn F- | xcos(nx)dx = (s + s) =0 
TJn JE n n ENEAS 

bn =] xsen(nx)dx = ( xcos(nx) EN en) = (—1) 
TJn T n n aa n 


e portanto 


Substituindo x = 7/2, temos 
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m eo (= 
= 2 z sen(n=) 
n=1 
ima ia Dib 
RS 579 i 
a série de Gregory, que nos dá um método para aproxima |r. « 


14.4 Forma exponencial 


A fórmula de Euler nos permite escrever funções trigonométricas em termos de exponenciaigff| 


Teorema 14.19 (fórmula de Euler). Para qualquer ângulo O € R, 


et? = cos(0) +isen(0), 
e como consequência, 
i0 io 
—e 
sen(0) = i 
0) ==, 
eis + ef? 
cos(0) = 


Usando a fórmula de Euler, observamos que 


inwx —inwx 
e — € 


sen(nwx) = - 5 
21 

einwx É eTinwx 
cos(nwx) = 2 


Substituindo na expansão de Fourier de uma função, obtemos a forma exponencial para a série de Fourier. 


00 
ao 
f(x) A a + 3. an cos (nwx) + bn sen (nwx) 
n=1 
So inwx —inwx inwx —inwx 
ao e +e e —e 
EN b 
a x i 2 TA 2i 


3A convergência da série de Gregory é bastante lenta. 

“Observando com cuidado o Teorema, notamos que como consequência, temos também a conhecida identidade de Euler, ei” = 
cos(7) + isen(7) = —1. 

*Uma demonstração simples usa a série de Taylor de ei*; 
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NI = 


A ; É 
. = byeinux bpe inwx 

E Sp anettex + ane inwx | f i 

l 1 


NI = 


oo 
E L >. Pr id + ane inox + [= iba jette = (jeto) 


(e0) 
ao + J 
Observando que os dois termos dentro do somatório diferem somente pelo sinal de n, podemos reescrever 


de forma mais compacta 
Time T: 
f(x) ~ 3 e: presa) , 
n—00 


(an — ibn ida + (an= onde 


com 
a-n +ib-n n<o0, ; 
Cn = 4 ao n=0 (porque eilux = 1) 
an — ibn n >00. 


Exemplo 14.20. A série de Fourier para f(x) = x em [—7, 1], dada no exemplo[14.18] tem coeficientes 
An =0 
2(—|)nH 
p, 20 
A forma exponencial desta série da Fourier é 


1/ O 
f(x) e 3 ( pa —ibpeinex — Ta 


n=00 


Temos w = 211/27 = 1, portanto 


o “(o qn+H] “qn+ 
9-5 [+ MA agem = « 


n n 
n=1 


14.5 Convergência 


A convegência de séries é um tópico extenso e que envolve muitas sutilezas. Nesta seção abordamos apenas 
algumas idéias básicas relacionadas à convegência de séries de Fourier. 

Apresentaremos tres diferentes noções de convergência - ou seja, definiremos de tres maneiras diferentes 
o que poderíamos entender por convergência para uma série de Fourier. Estas noções serão apresentadas 
da mais fraca para a mais forte. Há outras noções de convergência que não apresentamos aqui; o leitor pode 
encontrar um estudo mais extenso sobre convergência de séries na literatura de Análise [Rud76|/Apo74), e 


sobre séries de Fourier na literaura de Análise Harmônica [PW12||BC11;Zyg03]. 
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Para cada número k € N*, podemos listar os k primeiros termos de uma série de Fourier. Com diferen- 


n+l 
tes k obtemos diferentes funções. Por exemplo, a série de Fourier do exemplo(14.18é 3 >; su sen(nx), 


e obtemos dela a seguinte sequência de funções, onde fı (x) é a i-ésima função da sequência, obtida com os 
i primeiros termos da série de Fourier. 


fi(x) =2 sen(x) 
f2(x) =2 sen(x) — sen(2x) 


f3(x) =2 sen(x) — sen(2x) + i sen(3x) 


Formalizamos a seguir as definições de sequência e série de funções. 


Definição 14.21 (Sequencias e Séries de funções). Uma sequencia de funções (fn) é uma função de N* em 
um conjunto de funções, todas tendo o mesmo domínio e o mesmo contradomínio. 

Uma série de funções é a sequência obtida do somatório dos primeiros termos de uma sequência de fun- 
ções, 


Em particular, a série infinita para a sequência (fn ) é 
(e 0] 
> to. + 


i=1 


Exemplo 14.22. Definimos duas sequências de funções, 


fa(x) =nx 
9n (x) =(—1)"x 
halo) =— 
As sequências são: 
fı(x) =x gı (x) = — hy(x) =x 
f2(x) = 2x ga(x) = +x h2(x) = x/2 
fa(x) = 3x ga(x) = —x hs(x) = x/3 


As séries para fn, gn € hn são 


ne 


n=1 
Do 


$ g=) x= x+x—x+x 


n=1 
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Exemplo 14.23. Além das séries de Fourier, discutidas neste capítulo, outro exemplo relevante é o da série 

de Taylor, 

f” ( a) 
2! 


f(x) = f(a) + f'(a)(x — a) + (x— a)? + (x— a)? e. < 
Temos já clara a definição de série de funções, e passamos agora a tratar da convergência destas séries. 


Há diferentes noções de convergência para séries de funções, e apresentamos algumas delas: 


* Convergência quase sempre: a série deve convergir para a função em todos os pontos exceto por um nú- 
mero “pequeno” deles. O raciocínio é análogo àquele usado quando verificamos que pontos isolados 
não mudam o valor de uma integral, porque a área abaixo de um ponto é zero. 


e Convergência pontual: uma série fn converge para f se para cada x, fn (x) > f(x). 


e Convergência uniforme: a mais forte das noções de convergência; exigimos não somente que fn (x) — 
f(x), mas que seja possível, para algum n, que a distância entre fn (x) e f(x) seja tão pequena quanto 
queiramos, para todo x. 


Quando usamos apenas os n primeiros termos da série de Fourier de uma função f, temos uma aproxi- 
mação de f. Para medirmos a qualidade desta aproximação definimos uma noção de erro. 


Definição 14.24 (Erro na aproximação de função por série). Sejam f uma função e fn uma sequência de 
funções. O erro na aproximação de f pela série 


Snl) =} filx) 
i=1 
no ponto x é a diferença entre f(x) e Sn (x), 
En = f(x) — Sn (x)| + 
Exemplo 14.25. A expansão de Taylor de sen (a) é 
O ONY x 
sen(x) =x 3] + 17 H 9] 


Comparamos o valor de sen(1) com S4(1): 


sin(1) = 0.84147098480789 ... 
S4(1) = 0.84146825396825... 


Os valores diferem na quinta casa decimal, e o erro para esta aproximação é menor que 0.00001. < 
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14.5.1 Convergência quase sempre 


Sabemos como obter os coeficientes de Fourier para uma função f. Estes coeficientes determinam uma 
aproximação da função por uma série fn. 
Medimos a qualidade da aproximação em x pela norma 


b 
fo) = Sab)ll= | PAL- fn (x))Żdx, (14.6) 


a 


ou seja, integrando o quadrado do erro em x. Mostramos a seguir que, se tivermos uma família ortonormal 
{f1, f2, . . .} de funções e se for possível representar f como combinação linear das fi, os coeficientes de 
Fourier minimizam o quadrado do erro. 

Diremos que a série de Fourier para f converge quase sempre se a integral na igualdade[14.6/não é diver- 
gente. 


Definição 14.26 (Convergência quase sempre). A série fn converge quase sempre para f no intervalo [a, b] 
se 


b 
| [En (x) — f(x) dx = 0. (14.7) 
n— 00 a + 


Da mesma forma que a modificação de um único ponto não altera o valor de uma integral, ao definir 
a convergência desta forma, permitimos a divergência de uma série em pontos isolados, e ainda assim a 
tratamos como convergente. Por isso o nome “quase sempre”. 


Exemplo 14.27. « 


Queremos portanto que a integral na equação [14.7] não seja divergente. Observamos que [fn (x) — 
fO)P = fn(x)2 — 2£n (x)f(x) + f(x)2, e o que precisamos portanto é que fe [fn (x)? dx e E [f(x)? dx 
sejam convergentes. 


Definição 14.28 (Espaço L? de funções quadrado-integráveis). Uma função real ou complexa f é quadrado- 
integrável no intervalo [a, b] se 


b 
| [f(x] dx < o. 


a 


O conjunto de todas as funções quadrado-integráveis em [a, b] é denotado por L?[a, b]. 4 


Assim como na definição de l2 no exemplo usamos |f|2, e não simplesmente f2, porque f pode ser 
complexa. 


Exemplo 14.29. A função real f(x) = 4x! — x é quadrado-integrável no intervalo [0, 1] (f € L2[0,1]), 
porque f 4x! — xP dx = 7/9. 

Já a função g(x) = 1/x não é quadrado-integrável no intervalo [0, 1] (ou seja, g é L2[0, 1]), porque a 
1 2 


integral f x”! 2 dx é divergente (há uma assíntota vertical). 
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[HP 


Teorema 14.30. A série de Fourier de f converge quase sempre se 
oo 
(ar tba) 
n=1 
converge. 
De acordo com o teorema[14.31]L2 é um espaço vetorial. A demonstração é pedida no exercício[299] 


Teorema 14.31. Para quaisquer a, b reais ou complexos, L? [a, b] é um espaço vetorial com as operações usuais de 
soma de funções e multiplicação por escalar. Além disso, com o produto interno usual (exemplos[7.6/e 7.101), para toda 
função em L?, (f, f} < oo (ou seja, é finito). 


Os teoremas[14.32]e |14,33)indicam situações em que podemos concluir que uma série de Fourier con- 
verge quase sempre 


Teorema 14.32. Se f € L?[a, b], então a série de Fourier de f converge quase sempre. 


Teorema 14.33. Se tanto an como bn são tais que 


IA 


An 


ba 


IA 
228 |8 


onde p e q são constantes, então a série de Fourier com coeficientes an e bn converge quase sempre. 


14.5.2 Convergência pontual 


A idéia básica de convergência pontual é que, à medida que incluímos mais termos na série, fn (x) tende 
a f(x), para cada ponto x. Ao contrário da convergência quase sempre, não admitimos que fn (x) seja 
divergente de f(x) para nenhum x. 


Definição 14.34 (Convergência pontual). Seja (fn) uma série de funções. Se, para todo x no domínio de 
fns 
lim |fn(x)— f(x) = 0 


n— 00 


então a série converge pontualmente para f. + 
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Exemplo 14.35. Considere a série 


(0.0) 

X 
>. qn=—1" 
n=1 


A série converge pontualmente, porque para todo x 


«4 


Uma função contínua em partes é composta de várias funções, cada uma contínua em um intervalo, 
sem assíntotas verticais. 


Definição 14.36 (Função contínua em trechos). Uma função f é contínua em partes se seu domínio pode ser 
particionado em uma quantidade finita de intervalos disjuntos, e f é contínua em cada um dos intervalos, 
e o limite de f é finito em todo seu domínio. + 


Exemplo 14.37. Em qualquer intervalo, a função escada é contínua em trechos 
A função dada no exemplo também é contínua em trechos em qualquer intevalo. < 


Exemplo 14.38. Seja f : R — R definida da seguinte maneira. 


=f] sex EQ 
O sex¢Q. 


A função f não é contínua em partes, porque a única partição que resulta em intervalos onde a função é 
contínua terá infinitas partes racionais e irracionais intercaladas. « 


Teorema 14.39. Seja uma função f com período T. Se tanto f como f’ são contínuas em partes no intervalo 
[-T/2, +T/2], então a série de Fourier para f converge pontualmente para f. 


Teorema 14.40. Convergência pontual implica em convergência quase sempre. 


14.5.3 Convergência uniforme 


Há alguns problemas com a noção de convergência pontual: a função f para qual a série converge pode 
não ser contínua nem integrável, mesmo que cada função f da sequência seja. Além disso, embora fn (x) 
tenda a f(x) para todo x, para um n fixo não temos garantia de que a distância |fn (x) — f(x)| é limitada 
para todo x. A noção de convergência uniforme resolve estes problemas 
Definição 14.41 (Convergência uniforme). Seja (fn) uma série de funções. Se para todo e existe um No 
tal que para todo N > Ny e para todo x no domínio de fn, 


[fm (x) — f(x) < e 


então a série converge uniformemente para f. + 
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Exemplo 14.42. A série z=, que mostramos convergir pontualmente no exemplo[14.35| não converge 
uniformemente em R. 
Intuitivamente, podemos observar o seguinte: esta série é 


X X X 
-+- +- 


ra EA Tg 


seg 


ou seja, a soma de infinitas funções lineares. Sua aproximação com n termos é 


x x X x 
Snl) =x+5 tjt t tan 
claramente também uma função linear em x. 
A distância entre a função linear 2x (que é para onde a série converge) e outra função linear (sn (x) 
neste exemplo) poderá ser tão grande quanto queiramos, bastando para isso escolher x suficientemente 
grande, como ilustra a figura a seguir. 


distância 


1 2 3 4 


A seguir damos o mesmo argumento, de forma mais rigorosa. 
Seja e > 0. Se a convergrência fosse uniforme, haveria No tal que para todo N > No, 


(Em) 


Suponha x > 0, e tentaremos escrever N em função de e. Teríamos 


AE. 


`x. 4 
x (Zz) —2| <e 
i=1 
N 
1 € 
(> 15) =2 sa 
i=] 


e o valor de N dependeria de x - mas a definição de convergência uniforme exige que exista um No a partir 
do qual a distância entre a série e a função aproximada seja menor que e, para todo x. Assim, a convergência 
não é uniforme. < 


Exemplo 14.43. Seja fn : [0,1] > [0,1], tal que 


fax =x 
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A série fn converge pontualmente, porque 


lim fn(x) = fo x € [0,1) 


n= oo 1 x=1. 


No entanto, mesmo f(x) = x™ sendo contínua para qualquer n, a série converge para uma função descon- 
tínua - a descontinuidade está no ponto f(x) = 1. 

Além disso, mostramos que apesar de convergir pontualmente, a sequência não converge uniforme- 
mente. 

Seja e > 0 - por exemplo, e = 1/2. Suponha que a sequência tenha onvergência uniforme. Então 
existe algum No tal que, para todo N > No, e para todo x, 


No entanto, para qualquer No, pode-se escolher um valor de x próximo o suficiente de 1 de forma que 


f(x) > 1/2, como se pode perceber observando o gráfico da função abaixo (são mostrados os gráficos de 


x2, xf, xs ex!6), 


f(x) > 0.5 


0.5 + 


0.2 0.4 0.6 0.8 1 


Assim teríamos |f(x) — fn(x)| = |f(x) — 0| = f(x) > >. A sequência, portanto, não converge uniforme- 
mente. a 


Exemplo 14.44. A série 


nx 
fa(x) = 
r) = 
converge uniformemente no intervalo [2, oo] para 
x 
f(x) = 
x— 1 
Observamos que 
nx nx 


e portanto para e > 0 queremos 
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para todo N maior que algum No. 
Escrevemos € em função de No. Presumimos N > No,e 


Nx x | x N = 
(N+D(x—1) x-1/| |x-1AN41 
x N m 
dello DD a 
MO; o 
mx — 1 N+1 
x 1 
7 x>1N41 (pao) 
= x 1 
x— IN 
1 
ga a (N > No) 
x— 1 0 
2 
<a (porque x € [2, o0]) 
No 
KE 
Note que No depende de e, mas não de x. Desta forma, só precisamos que 2/No < e, ou No > 2/e. ~« 


Proposição 14.45. Convergência uniforme implica em convergência pontual. 


Teorema 14.46. Seja f uma função com expansão de Fourier dada por coeficientes an e bn. Se a série 


3 (anl + Ibal) 
n=1 


converge, então a série de Fourier para f converge uniformemente e f é contínua. 


Exemplo 14.47. A expansão de Fourier para 


(ON 


sen(nn) 

an = — —— 

mn 

sen(nn) — nn cos(7n) 
bn = 


nn? 


A série 
sen(7n) — nn cos(7mn) 
mn? 


> 


n=1 


Tn 


sen(nn) | | 
T 


converge, portanto a série de Fourier converge para uma função contínua. < 
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Teorema 14.48. Se f é contínua em [—7, +7], f(—7) = f(+7) e a derivada de f é contínua em trechos, então a 
série de Fourier para f converge uniformemente. 


Teorema 14.49. Se an e bn são tais que 


P 
an Shr 
q 
BS 


com x,y, p, q constantes e x,y > 1, então a série de Fourier com coeficientes an e bn converge uniformemente. 


14.6 Transformada de Fourier 


Da mesma forma que pudemos aproximar funções periódicas por séries, podemos fazer o mesmo com 
funções não-periódicas. Para isso usamos a transformada de Fourier, que é uma generalização da série de 
Fourier quando o período da função tende ao infinito. 

A transformada de Fourier é, portanto, semelhante à série de Fourier: dada uma função qualquer, sua 
transformada de Fourier será uma outra função, no domínio da frequência. 


F(f(x)) = F(ẹ), 


onde G mapeia frequencias p em amplitude. Também é possível, dada G, obter a função através da trans- 
formada inversa de Fourier: 
F`! (F(p)) = f(x). 
A série de Fourier de uma função é um somatório discreto, com os coeficientes calculados a partir da função 
original. Quando a generalizamos, tomando seu limite quando o período tende ao infinito, este somatório 
torna-se uma integraf] 
Na forma exponencial, a série de Fourier de f(x) tem coeficientes 


1 DP. 


xo—T/2 


f(x) e 2minx/T dx. 


Desenvolvemos informalmente a definição da transformada de Fourier.Quando o período T tende a oo, 
temos 


— dọ (frequência tenderá a zero) 


PERE 


> 4 
Cn > F(p)do. 
Como consequência disso chegamos à definição da transformada de Fourier, dada a seguir. 


Definição 14.50 (transformada de Fourier). Seja f uma função complexa. Sua transformada de Fourier é 


+oo 
F(p) = | f(x)e 2x dx, 


—00 


évale lembrar a definição de integral como limite de somatório de n termos quando n — oo. 
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A transformada inversa de Fourier de F(p) é 


Sua transformada de Fourier é 


+00 
= | gira Je 2mibx dx 
— CS 
He i p? 


Isto significa que f pode ser descrita como uma soma de infinitas formas de onda, e que a amplitude da forma de onda 
com frequência d é 


Alb) = me 4”. « 
Exemplo 14.52. A função a seguir não é periódica. 
1 
f 3 
=z Fi 


Sua transformada de Fourier é 


Teorema 14.53. A transformada de Fourier é um operador linear: 


F(f +g) =F(f) +F(g) 
F(af) = aF (f). 


Teorema 14.54 (de Rayleigh). A energia total é a mesma nos dois domínios. 


+00 +00 
| Foa = | E~ (p)Pap 


— 00 —00 
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14.7 Aplicações 


14.7.1 Equações diferenciais | série de Fourier | 

Uma breve introdução às Equações Diferenciais é dada no Apêndice[ô| Nesa seção abordamos alguns mé- 
todos para resolver estas equações usando séries de Fourier. 

Resolvendo uma equação diferencial [ série de Fourier ] 


Expandir uma função como série de Fourier pode ser útil em diversas situações. Por exemplo, ao resolver 
uma equação diferencial, pode ser interessante reescrever funções como suas séries de Fourier. 
Para exemplificar, resolveremos a equação diferencial linear não homogênea 


com as condições de contorno 


Tomamos a função 2x e a expandimos como série de Fourier no intervalo [0, 1] (que é o que nos interessa, 
conforme as condições de contorno dadas). Encontramos 


4 — (-W"sen(nrx) 
2x = 
T 2 n : 
n=1 
portanto já podemos reescrever a equação. 


4 © (—-W"sen(nrx) 
pa f 


TE n 


y M | 3y = 
n=1 
Agora, presumimos que a expansão de Fourier para y(x) só tem os termos senóides (os cossenóides tem 
coeficiente zero). Presumimos isto porque as condições de contorno exigem que y(0) = y(1) = 0, e isto 
só pode acontecer para uma série de senóides: sen(0 nn) = sen(1 nr) = 0, porque n é inteiro. Para 
cossenos não teríamos zero. A solução para esta equação deve ser então da forma 


y(x) = 3. ba sen(nrx). 
n=1 


Substituímos na equação, e chegamos a 


y s 3y 2x 
—— AN, 


E es g 4 & (—1)" sen(nnx 
a J bn sen (nnx) +3 J bn sen(nnx) = = J Eu E l ) 
n=1 n=1 n=1 
z ai 4 & (-1)"sen(nrx) 
2.2 — 
J n^n bn sen(nax) +3 J bn sen(nnx) = E J E 


n=1 n=l n=1 
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asd [sem (nro 


(0,0) 
pl (3 — nên? )bn sen(nrx) 
n=1 


n=1 


Só precisamos portanto garantir que os coeficientes de bn nos dois lados da equação sejam iguais: 


(3 a nên? )bn = An 


e temos finalmente a solução, 


Oscilador harmônico forçado [ série de Fourier ] 


Considere o sistema massa-mola a seguir. A massa m com 1kg está presa a uma mola com constante elástica 
k = 5, e uma força F de 1N atua sobre a massa periodicamente, atuando por um segundo e parando no 
segundo seguinte. 


Para simplificar a exposição, supomos que o movimento não é amortecido. 


A posição x da massa é dada pela equação diferencial 
x” +5x = F(t), (14.8) 


onde Fé 


_ fo tel1,0) 
k=l te [0,1]. 


O gráfico de F é mostrado a seguir. 
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A posição é claramente dada em metros, já que usamos kg para a massa e Newtons para a força. 

Suponha que queiramos encontrar a solução geral (note que todas as soluções são periódicas) para esta 
equação diferencial. 

Usaremos o seguinte Teorema, que enunciamos sem demonstração] e aplicaremos o método dos coefici- 
entes indeterminado] 


Teorema 14.55. Sejam yı e y2 duas soluções fundamentais para a equação homogênea 
y” +ay'+by=0, 
ou seja, a solução geral da equação homogênea é 


Pya + Qua, 


onde P e Q são constantes arbitrárias. 
Seja yp uma solução particular para a equação não homogênea 


y” + ay' + by = f(x). (14.9) 
Então toda solução para[i4.9]é a soma de Yp com uma combinação linear de yı e y2, ou seja, é da forma 
ayı + Byz + Yp. 


A partir deste Teorema, chegamos naturalmente no método dos coeficientes indeterminados, que con- 
siste em 


i) Encontrar a solução geral Ayı + By2 para a equação associada homogênea; 


ii) Encontrar uma solução yp particular para a equação não-homogênea; 


70 leitor encontrará a demonstração em livros sobre Equações Diferenciais Ordinárias (por exemplo, cap. 2 de - mas O 
leitor pode tentar demonstrá-lo: começe verificando que a diferença entre duas soluções da equação não-homogênea é solução para 
a homogênea.) 

80 leitor familiar com este método observará que a parte interessante deste problema está na função F(x), que se comporta como 
onda quadrada - isto torna o problema diferente dos exemplos iniciais usados na descrição do método em livros-texto, que normal- 
mente não chegam a usar a expansão de Fourier de F. 
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iii) Descrever a solução geral da equação não-homogênea como Ayı + Byz + yp. 
Começamos por (i), obtendo a solução geral de 
x” +5x=0, (14.10) 


que é a equação homogênea associada à equação Como m, k > 0, a equação homogênea tem solução 


geral 
k k 
A cos (y x) + Bsen (y =) ; 
m m 
Como temos k = 5 e m = 1, a solução geral de[14.10]é 
Ye = A cos (tv5) + B sen (tv5) ; 


Passamos para o passo (ii), e calculamos a expansão de Fourier de F(t), obtendo 


ao = 1 

an = 0 

da S e cm! EA n ímpar 
am 0 n par. 


Usaremos a expansão de F e a compararemos com a da solução geral que queremos para x, assim temos 


1 2 
F(t) ~ zt | a fo sen(nrt), 
i=1, (ímpar) 
do 


2 + ba an cos(nrt) + bn sen(nrt). 


i=1 


x(t) 


Claramente, a, = O quando n > 0, e bn só será diferente de zero para n ímpar. Substituímos a expansão 


de x no lado esquerdo da equação/[14.8] 


x" +5x= E + BO bh ento) +5 E + >. bh ento) 


i=1 i=1 


= (È (n?n? )bn senta) + Zao +5 a bn sen (nrt) 


i=1 


5 [6.0] 
= 500 + > (5— m2n2)b, sen(nrt). 


i=l 
Agora podemos escrever a equação inteira, substituindo as duas expansões: 
x” +5x = F(t) 


5 - 1 =Z 2 
20 + ba (5 — m2n?)b, sen(nat) = z + > = sen(nrrt), 


i=] i=1 (ímpar) 
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e temos igualdade com 5ao = 1, ou ao = 1/5,e 
2. 2 2 
5— n^n bn sen(nnt) = — sen(nrt 
rn 
5-mrnb, = — 
™ m(5- mn?) 


Com estes coeficientes, temos uma solução particular para 


TO 2 
w=] a m A) sen(nrt). 


Podemos agora passar ao passo (iii) e somá-la à solução geral para a equação homogênea associada e final- 
mente teremos a solução geral para 


[a cos (tv5) + B sen (tv5) | +Xp- 


Observe que a corrente elétrica no circuito LC descrito a seguir obedece a mesma equação que usamos para 
descrever a posição da massa no sistema massa-mola. A determinação da corrente em circuitos desse tipo 
é realizada da mesma forma. 


L=10H, 
1 
C=-F 
2 
Neste diagrama, U é uma fonte de energia de 1V, que liga periodicamente (fica ligada por 1s e desligada 
por 1s). 
A equação que dá a corrente em função do tempo neste circuito é 


; 1. 
i” + LC! = U(t), 
e como 1/LC = 5, temos 


i” +5i= U(t). 


14.7.2 Equações diferenciais parciais: a equação da onda [ série de Fourier 
] 


Uma corda de violão está fixada em dois pontos que presumimos estarem alinhados com o eixo x. A 
distância entre as duas pontas é L. Quando a corda é tocada vibra, oscilando verticalmente. 


14.7. APLICAÇÕES 443 


Seja y a função que descreve o deslocamento vertical da corda em função do tempo t e do deslocamento 
horizontal x. 
Quando a corda está vibrando, y(x, t) obedece a equação da onda: 


dy 0y 
t2 


ðx2 


onde c é a velocidade em t = 0. 
A corda não se move nas duas pontas, ou seja, y = 0 tanto em x = 0 como em x = L. 


y(0,t)=0 (14.11) 

y(L,t)=0 (14.12) 
Além disso, sabemos a posição e a velocidade da corda no instante t = 0, ou seja, 

y(x, 0) = f(x) (14,13) 


ð 

gY 0) = g(x) (14.14) 
Queremos determinar y(x, y) em função de x e t. Usamos o método da separação de variáveis: presumimos 
que a função y pode ser decomposta em duas partes, X(x) e T(t), tais que 


y(x, t) = X(x) T(t). 


Assim, teremos duas funções diferentes, uma dependendo apenas de x e uma dependendo apenas de t. 
(Vale lembrar que este também foi o objetivo do uso da diagonalização de operadores na solução de sistemas 
de equações diferenciais). 

Partindo da equação original, temos então 


ay 20y 
dt? ox 
ð? o? 
TE) (x)T(t) = (x)T(t) 


X(x)T” (t) = 2X" GoT(t) 
KUN 1 T”(t) 
X(x) c2 T(t)” 


Os dois lados da equação são iguais, e como o lado esquerdo não depende de t e o direito não depende de x, 
então nenhum dos dois pode depender de nenhuma variável - os dois lados descrevem a mesma constante. 
X"(x) TER 1 T”(t) 
X(x) ` c2 T(t) 
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Temos portanto duas equações diferenciais: 


X” (x) —kX(x) 


=0 
T()-ckT(t) =0 
Temos que stisfazer as condições de contorno dadas (Equações[14.11]e[14.12). 


y(0,t)=0 > X(O)T(t) =0 => X(0)=0 
y(L,t)=0 > X(L)T(t)=0 > X(L)=0 


Agora voltamos a atenção para a equação 


X"(x) -kX(x) = 0 


X(0) = 0 
X(L)=0 


Se k > 0,a solução para esta equação é X(x) = 0, que obviamente não nos interessa, porque implicaria 
em X(x)T(t) = 0, e portanto y(x, t) = O sempre. 
Presumimos portanto que k é negativo, ou seja, k = —p? para algum p. Então a solução é 


X(x) = Acos(px) + Bsen(px), 

* Como X(0) = 0, necessariamente temos A = 0. 

* Como X(L) = 0, necessariamente temos B sen(pL) = 0. 
Assim, como B Æ 0, sen(pL) = 0 implica em 

pL=na 
na 
== T? 

para qualquer n inteiro diferente de zero. 

Esta seção está incompleta! 


14.7.3 Música 
14.7.4 Compressão de dados [ transformada de Fourier ] 


14.7.5 Espectroscopia de infravermelho [ transformada de Fourier ] 


Para uma exposição detalhada, veja os livros de Griffiths e Haseth [GH07] e de Davis, Abrams e Brault [DABO1). 


Leitura Adicional 


Há uma grande quantidade de bons textos que tratam de séries de Fourier mais extensivamente e em 
mais profundidade do que o fizemos neste Capítulo. Citamos os livros de Jackson [Jac04], Brown e Chur- 


chill [Bc11], Davis [Davs9], Pereyra e Ward [PW12], e Zygmund [Zygo3]. 
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Exercícios 


Ex. 299 — Prove o teorema/14,31 
Ex. 300 — Prove o teorema(14.,15 


Ex. 301 — As funções periódicas de mesmo período formam um espaço vetorial? (Prove que sim ou que 
não) 


Ex. 302 — Calcule a série de Fourier que aproxima: 


e(x) =cos(x), x € [0,27] 


q 
Kas 
II 
— 
z 
LS 


hix) =41 se0<x< Tn 
P L se =n <x <0, 


i(x) =x, x € [>r, n] 


Ex. 303 — O que acontece com os coeficientes de Fourier para funções pares e ímpares? 
Ex. 304 — Calcule a expansão de Fourier para 


f(x) = cos” (x) + sen” (x). 


Ex. 305 — No exemplo|14.43|mostramos que a série fn(x) = x” converge pontualmente mas não uni- 
formemente no intervalo fechado [0, 1]. Determine se a sequência converge uniformemente no intervalo 
aberto [0,1). 


Ex. 306 — Prove que se f € L?[a, b], então a sequência de coeficientes de Fourier para f, ao, 01,b1,..., 
pertence a (2. 


Ex. 307 — Prove o Teoremaļ14.53 


Ex. 308 — Determine a transformada de Fourier de 


a) f(x) = ei 


b) g(x) = cos(x?) 


Ex. 309 — Seja 


f(wt) = TA se sin(wt) > 0 
0 se sin(wt) < 0 


i) Determine os coeficientes de Fourier para esta função. 


ii) Verifique que a série converge para o valor correto em t = 0. 
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Ex. 310 — Diga se a série de Fourier calculada no Exercício|309|converge quase sempre, pontualmente ou 
uniformemente. 


Ex. 311 — Os coeficientes em uma série de Fourier são as coordenadas de uma função periódica em uma 
base, fn (x) = cos(271nx/T), gn (x) = sen(27nx/T), comn € N. Mostre outra base para o mesmo espaço 
(das funções com período T). 


Ex. 312 — Seja f uma função não periódica. Qual é o efeito de (1) expandirmos a série de Fourier de f usando 
domínio de integração [a, b], (2) aplicarmos a transformada inversa de Fourier na função resultante? 


Ex. 313 — Na seção/14.7.1| obtivemos como solução para a equação diferencial a função 
ç çao p q 


Mas y é descrita como uma série. Há alguma maneira de obter uma forma fechada para y? 


Ex. 314 — Na Seçãoļ|14.7.1[obtivemos a solução geral para a equação diferencial que descreve um oscilador 
harmônico não amortecido. Suponha agora que o movimento é amortecido, e que a equação que o descreve 


é 
x" +2x'+5x= F(t). 


Use a mesma técnica descrita naquela seção para obter a solução geral desta equação. 


Ex. 315 — Prove que as séries de Fourier usadass no exemplo da Seção|14.7.1|converge. Faça o mesmo para 
as séries que usou no Exercício 


Ex. 316 — Resolva a equação do calor, 


ou Zu -o 

ot ox? ? 
sujeita às condições 

u(x,0) = f(x), 

u(O,t) = 0, 

u(L, t) = 0, 


Capítulo 15 


Tensores 


Este Capítulo é uma brevíssima introdução aos tensores, que são uma generalização de alguns dos objetos 
de que tratamos no resto deste livro - escalares, vetores e matrizes. 


15.1 Espaço dual e funcionais lineares 

Definição 15.1 (Funcional linear). Seja V um espaço vetorial sobre um corpo K. Uma função linear de V 
em K é um funcional linear. + 
Exemplo 15.2. A função f : R? — R, dada por 

f(x, ya =2x—z 
é um funcional linear em Rº. <a 
Exemplo 15.3. A função f : R? — R, dada por 
f(x, Y, zZ) = xyz + xy +yz + xz 
não é um funcional linear em R$, porque não é linear. « 


Exemplo 15.4. No espaço Cº[0, 1], a integral 


é um funcional linear, porque 


1 1 
| asligax = a | f(x) dx, 
0 0 


1 1 


f(x) dx + | g(x)dx. < 
0 


ji f(x) + g(x)dx zf 


0 0 


Claramente, funcionais lineares em espaços de dimensão finita são representados por vetores-linha, por- 
que são transformações de V” em V!. 
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Exemplo 15.5. A função f : R? — R, dada por 
f(xyz)=x—2y+3z 


é um funcional linear em R3, cuja representação como matriz é 


F=(1 —2 3). 
Claramente, se v = (x,y, z)! , então 
x 
Fv=(1 —2 39)|y)=x—2y+3z. « 
Z 


Definição 15.6 (Espaço dual). Seja V um espaço vetorial. O espaço dual de V é formado por todos os funci- 
onais lineares definidos em V. Denotamos o espaço dual de V por V*. + 


A dimensão do espaço dual de V é igual à de V - a demonstração disso é pedida no Exercício 
Teorema 15.7. Seja V um espaço vetorial. Então dim V* = dim V. 


Exemplo 15.8. O espaço dual de R? é o espaço vetorial formado por todas as funções lineares em R? - ou 
seja, por todos os vetores linha com 3 elementos. Este espaço claramente tem a mesma dimensão que R3, 
já que pode ser gerado por qualquer base de R? com os vetores transpostos. 


Por exemplo, como 
1 0 0 
B=+4lo), {1]> lo 
0 0 1 


[(1,0,0), (0,1,0), (0,0,1)) 


é base de (Rº)*. < 


é base de R3, então 


15.2 Covariância e contravariância 


15.3 Notação de Einstein 


Muitas vezes acontece de precisarmos descrever, em fórmulas, somas semelhantes ao produto interno em 
R™. Normalmente escrevemos 
n 
` aibi- 
i=1 


No entanto, quando há muitas destas somas em uma fórmula (como de fato acontece em Cálculo Tensorial), 
a quantidade de símbolos de somatório torna-se um problema. Quando trabalhamos com tensores, usamos 
a notação de Einstein: 


* Se um índice i aparece exatamente duas vezes em um termo, uma vez como subscrito e uma em 
sobrescrito, presume-se a soma para todos os valores de i, que deve ficar claro pelo contexto. 
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* Um mesmo índice não pode aparecer mais de duas vezes na mesma fórmula. 


Ou seja, 
oea pr De = + abr 
i 


Exemplo 15.9. Seja B = (b;,...,bn) uma base, e um vetor com coordenadas ay, a2,... 


Sabemos que este vetor é 
v=a'bı +--+ a”bn 
n 
= a a'b;. 
i=] 
Usando a notação de Einstein, podemos dizer que 
Y= abi, 
onde fica implícita a soma para todos os valores de i. 
Exemplo 15.10. O traço de uma matriz quadrada é 
TrA = al. 
Exemplo 15.11. O produto interno usual em R” é 


(v, w) = viwi. 
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, an nesta base. 


< 


Exemplo 15.12. Sejam A e B duas matrizes compatíveis para multiplicação, de forma que AB é definido. 


Usando a notação usual, C = AB é dado por 
q 
i ink 
=> aj 
k=1 
Usando a notação de Einstein, o mesmo produto é descrito como 


io aink 
cj = by. 


15.4 Tensores 


15.4.1 Operações com tensores 
Definição 15.13 (Produto tensorial). 


Definição 15.14 (Contração). 
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15.4.2 Produto tensorial de espaços vetoriais 
15.5 Aplicações 
Exercícios 


Ex. 317 — Prove o Teorema(15.7] 


Ex. 318 — Prove que todo tensor semidefinido positivo S tem raiz quadrada, ou seja, existe U tal que U? = 
S. 


Apêndice « 


Revisão: Sistemas Lineares e Matrizes 


Este Apêndice trata de matrizes, operações básicas sobre elas e sistemas de equações lineares, a fim de 
possibilitar a revisão destes conceitos. Alguns tópicos, no entanto, são omitidos, uma vez que são abordados 
de maneira mais adequada no corpo do texto: a representação de sistemas de equações lineares na forma 
matricial e a regra de Cramer. 

Os tópicos são apresentados de forma como poderiam ser apresentados no ensino médio, sem requisitos 
adicionais - e mesmo nesta revisão presume-se que o leitor está habituado à notação de somatório. As 
aplicações no final do Apêndice são também as que normalmente são dadas (ou que poderiam ser dadas) 
no ensino médio, mas seguem com referências bibliográficas mais avançadas para leitura adicional. 


&.1 Sistemas de equações lineares 


Definição «.1 (Sistema de equações lineares). Um sistema de equações lineares é um conjunto de equações, 
cada uma representando uma relação linear entre várias variáveis. Uma solução para um sistema de equa- 
ções lineares envolvendo variáveis x1,x2,...,Xn é um mapeamento de cada x; para um valor, de forma 
que todas as equações do sistema sejam satisfeitas. Formalmente, descrevemos um sistema de equações 
lineares como 


AX + Groxz +... +FanXn = bi 
a21X1 + Q22X2 +... tam = b2 
AmiX1 + Am2X2 H.. HamnXn = bm 
onde os aij são os coeficientes e os x; são as incógnitas. 
Quando todos os b; são zero, o sistema é homogêneo. + 


É conveniente, quando trabalhamos com sistemas lineares, dispor as equações de forma que cada va- 
riável x; apareça alinhada verticalmente em todas as equações. 


Exemplo «.2. O sistema 
xi+x2 +x3— X4 =2 
X4 — X3 = 3 
X2 — X3 =2 
X3 = 5 
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é mais convenientemente visualizado com as variáveis alinhadas: 


xi +XxX2 +X3 — x4 =2 
— x3 +x4 =3 
X2 — X3 = 


X3 = 
Exemplo «.3. Considere os dois sistemas lineares a seguir. 


2x1 — x2 =8 3x1 + 8x2 — x3=0 
xı +x2 = 30 —x1 — 3x2 + 9x3 = 0 


O primeiro sistema não é homogêneo, porque tem constantes 8 e 30 no lado direito das igualdades. Já o 
segundo é homogêneo, porque o lao direito das equações é zero. < 


Definição «.4. Um sistema linear é chamado de possível, ou consistente, se tem solução, e de imposível ou 
inconsistente caso contrário. Um sistema consistente pode ter exatamente uma solução - e neste caso é 
chamado de determinado ou infinitas soluções - quando é chamado de indeterminado. + 


Exemplo «.5. O sistema a seguir é consistente e determinado. As duas equações representam duas retas 
diferentes que se cruzam, portanto a solução é o ponto de R? que satisfaz as duas equações - exatamente 


o ponto onde cruzam. 
2x+y=0 
x+y=1 


O próximo sistema é consistente, mas indeterminado. As duas equações representam a mesma reta, por- 
tanto quaisquer valores de x e y que representem pontos desta (ou seja, com y = 2x — 1) reta são soluções. 


2x— y= 
4x —2y=2 


Finalmente, o sistema a seguir é inconsistente: as equações representam duas retas paralelas, e não há 
ponto em comum entre elas (não há (x,y) satisfazendo as duas equações). 


x+y=1 a 
x+y=3 


Definição «.6 (Sistema lineares equivalentes). Dois sistemas lineares são equivalentes se admitem exata- 
mente as mesmas soluções. + 


Exemplo «.7. Considere os sistemas a seguir. 
3x+y=0 x+3=0 
x—-y=5 4x =5 


Os dois sistemas são equivalentes, porque são ambos determinados e admitem apenas a mesma solução 
x=5/4,y=—15/4. < 
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Definição «.8 (Forma escalonada por linhas de um sistema linear). Suponha que um sistema linear esteja 
descrito de forma que as variáveis em cada equação aparecem sempre em uma mesma ordem. Este sistema 
está na forma escalonada por linhas (ou triangular) se em cada linha, a primeira variável com coeficiente 
diferente de zero não aparece (ou seja, tem coeficiente zero) nas outras linhas. 

A primeira variável com coeficiente diferente de zero em uma linha é chamada de pivô. Se todos os 
pivôs são iguais a um, o sistema está na forma escalonada reduzida por linhas. + 


Exemplo «.9. Os seguintes sistemas estão na forma escalonada. O último está na forma escalonada redu- 
zida. 


xi +x2 +x3 =2 
—5xy — X2 =2 —x1—x2+x3=1 l & E 
x2—x3=1 « 
X2 = 4 X2 =0 
X3 = 10 
Exemplo «.10. Os sistemas a seguir não estão na forma escalonada. 
—x— x2 + x3=0 
í 7 4x1 =N +2x3 =6 
2xı + x2 =0 xı — x2+3x3 =0 
— 7x2 + 5x3 =5 « 
—3x1 — 8x2 = 1 3x2 + 2x3 =0 
3x2 — x3=1 
8x3 =0 


&.1.1 Resolução de sistemas escalonados por linhas 


Um sistema na forma escalonada por linhas pode ser resolvido facilmente através de substituição de variá- 
veis: 


i) Se aúltima linha contém uma única incógnita, seu valor já está determinado. Substituímos este valor 
nas linhas de cima e retiramos esta última linha do sistema, resultando em um novo sistema. 


ii) Se a última linha contém mais de uma incógnita, o sistema é indeterminado. 
iii) Se a última linha não tem variáveis e é da forma O = bi, com b; Æ 0, o sistema é inconsistente. 


Repetimos este processo até ter obtido os valores de todas as variáveis ou determinar que o sistema não 
tem solução. 


Exemplo «.11. Considere o sistema triangular a seguir. 


xi+x2+ x3=2 
—x2— x3=1 
2x3 = 10 


Resolveremos este sistema usando as regras (i), (ii) e (iii) mencionadas anteriormente. 


x +x2+ x3=2 
(i);x3=5 
E 


X1 e X2 ag 5 = 2 reorganizando X1 F X2 = =3 
5=1 x2 =6 
— X92 — fm — = 
2x3 = 10 $ 2 
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X1 6=—3 
ex, = 9. A solução para o sistema é 
X1 = 
X2 = —6 
x3=5 «4 


Exemplo «.12. Considere o sistema 


—2xı +x2 + x3 +x4=l 


x2 — 3X3 T X4 =0 


X3 = —4 
Tentaremos resolver usando as regras mencionadas. 
—2xı +x2 + x34+x4=1 
(i);x3=—4 —2x, +x2 + x4 =5 (ii) 
x2— 3x3 +x4 =0 E call 
x2+x4 = —12 
X3 = —4 


Aqui percebemos que o sistema tem infinitas soluções: x2 e x4 podem variar de forma que sua soma seja 
—12. Continuamos, para obter o valor de x1. Determinamos que x2 = —x4 — 12: 


—2x1 + [-x4 ATA + x4 =5 


Então 
—2xı — 12 = 5, 


e temos xı = —17/2. < 


&.1.2 Resolução de sistemas lineares na forma geral 


Pode-se resolver sistemas de equações lineares usando três operações elementares, que não mudam a solu- 
ção do sistema, a fim de transformar o sistema original em um sistema na forma escalonada. As operações 
elementares são: 


* Permutar a posição de duas equações. 
* Multiplicar uma equação por uma constante. 
* Somar um múltiplo de uma equação a outra. 


Seja um sistema na forma 


a11X1 + Q12X2 +... + anXn = b] 


a21X1 + 022X2 + ... + A2nXn = b2 
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Am1X1 + Am2X2 +... + AmnXm = bm 


Modificaremos uma coluna da matriz de cada vez. A modificação de uma coluna é uma fase do algoritmo. 
Na primeira fase, eliminamos xı de todas as linhas abaixo da linha 1; na segunda fase, eliminamos x2 de 
todas as linhas abaixo da linha 2; e sucessivamente, eliminamos x; de todas as linhas abaixo da linha i. O 
diagrama a seguir ilustra o processo - ali, os pontos (e) representam coeficientes das variáveis. 


fase 1 fase 2 
o A 
ex] + 0x2 + 0x3 +: +0xn = bı exi + 0x2 + 0x3 +---+oex, = bı 
ex1 + 0x2 + 0x3 +: +0Xn = b2 ex2 + 0x3 +::: +0Xn = b2 
@©x1 + 0x2 + 0x3 +--+ exp = b3 ex2 + x3 +--+ 0xn = b3 
ex1 + 0x2 + 0x3 +: +0Xn = b4 ex2 + 0x3 +--+ exp = b4 

fase 3 próximas fases 
p MG PE a O 
exi + 0x2 +0x3 +---+oxn = bı exi + 0x2 + 0x3 +---+oxn = bı 

ex2 + 0x3 +- +60Xn = b2 ex2 + 0x3 +--+ 0x = b2 
ex3 +: + exn = b3 ex3 +--+ 0Xn = b3 
ex3 +- -:-+60xn = b4 "e + Xn = b4 


Suponha que a linha i contenha x; com coeficiente «. Suponha também que a linha j tenha coeficiente ßB 
para x; - ou seja, as linhas i e j são 


.. + XXi + 


«+ Bxi fp. = bj 


Para eliminar x; da linha j, somamos —ß /« vezes a linha i à linha j: 


„a XXi +... = bi 
.. + ((—B/&)æxi) + Bxi +... = (—B/0)b; + bj 
O resultado será a eliminação de x; da linha j: 
. + Oxi +.. = (-B/0)b; + bj. 


Este método é chamado de eliminação de Gauss. 
Exemplo «.13. Transformaremos o sistema a seguir na forma escalonada. 
—2xı — x2+4+7x3=1 
3x1 — 2x2 + x3=—1 
xt x2+3x3 =4 
Somamos à segunda linha 3/2L; e à terceira, —1/2L): 
—2x1 — x2 + 7x3 = 1 
—7/2x2 + 23/2x3 = 1/2 
3/2x2— 1/2x3 =7/2 
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Agora somamos à última linha 3/7L>, obtendo um sistema na forma escalonada: 


—2x1 — x2 + 7x3 = 1 
— 7/2x2 + 23/2x3 = 1/2 < 
31/7x3 = 26/7 


&.2 Matrizes 


Definição «.14 (Matriz). Uma matriz é uma coleção de objetos dispostos em uma grade, de forma que todas 
as linhas tem a mesma quantidade de colunas. Uma matriz com m linhas e n colunas é também chamada 
de “matriz m x n”, e é usualmente denotada com seus elementos dispostos de maneira retangular, entre 
parênteses, como a matriz A abaixo. Também é comum dispor os elementos da matriz entre colchetes, 
como a matriz B abaixo, que é p x k. 


a11 a12 ... Aln a11 Q12 ... dk 

a a Bea a a ... q 
A-= a 22; pn : B= uu 22 zk 

AmI Am2 +... Amn pi ap2 ... Apk 


Pode-se também denotar as matrizes acima por A = [aij] e B = [bgn]. Usualmente fica subentendido que 
os elementos de uma matriz M são m11, M12, ... + 


É comum denotar matrizes por letras maiúsculas e seus elementos pela mesma letra, minúscula, com 
a linha e coluna em subscrito. 


Exemplo «.15. A matriz A mostrada a seguir é 2 x 3. 


A-(024 
135 
Temos a11 = 0,012 = 2, etc. < 


Definição «.16 (Classificação de matrizes). Uma matriz é quadrada se seu número de linhas é igual ao seu 
número de colunas. Dizemos que uma matriz quadrada com n linhas e colunas é de ordem n. Uma matriz 
é triangular superior se os elementos abaixo de sua diagonal são todos zero. Similarmente, uma matriz é 
triangular inferior se seus elementos acima da diagonal são zero. Uma matriz que é tanto triangular superior 
como triangular inferior é uma matriz diagonal. Uma matriz com uma única coluna é um vetor coluna, e uma 
matriz com uma única linha é um vetor linha. Uma matriz A é simétrica se aij = aji para toda linha i e 
coluna j (ou seja, a parte acima da diagonal é refletida na parte abaixo da diagonal). Uma matriz A é anti- 
simétrica se aij = —ai; para toda linha i e toda coluna j (ou seja, a parte acima da diagonal é refletida com 
sinal trocado na parte abaixo da diagonal, e a diagonal é zero). + 


Exemplo «.17. A matriz A a seguir é quadrada. C é triangular superior. D é diagonal (e portanto trian- 
gular). E é simétrica e F é antisimétrica. G é um vetor coluna, e H é um vetor linha, J é anti-simétrica. B 
não é classificada de nenhuma dessas formas. 


Deo apo Sá a 1-1 1 100 
A=| 381012) B={|3 4] C=lo 2-2] D=| 010 
14 16 18 5 6 o dO 3 002 
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< 


Usaremos a notação diag(x1,x2,...,Xn) para a matriz diagonal com elementos x1, x2, . . . , Xn na dia- 


gonal. 
100 
09 0]: < 
002 


Definição «.19 (Matriz identidade). Uma matriz quadrada onde os elementos da diagonal são iguais a 1 e 
os outros são iguais a O é chamada de matriz identidade. Denotamos a identidade por T: 


Exemplo «.18. A matriz diag(1,9,2) é 


TO ai O 
ri , 
0 0 O 
Exemplo «.20. As matrizes identidade de ordem 3 e de ordem 4 são mostradas a seguir. 
100 1000 
0100 « 
RR 0010 
001 
00041 


x.2.1 Operações com matrizes 


Duas matrizes podem ser somadas e multiplicadas, desde que os elementos das duas admitam as opera- 
ções de adição e multiplicação, e o número de linhas e colunas permita as operações. Também é possível 
multiplicar uma matriz por um escalar, desde que seja possível multiplicar o escalar pelos elementos da 
matriz. 


Definição «.21 (Soma de matrizes). Sejam A e B matrizes, ambas m x n. Então A + B = C, onde cij = 
aij + bi; - ou seja, cada elemento com coordenada i, j de A é somado com o elemento com coordenada i,j 
de B resultando no elemento de coordenada i,j em C. + 


iso -2 PEF ] . 
-3 2 2 1 43 E 65 
1x2 a 0 1 fa+l x 1 
(3 y 2) +(e 4 a) a y+4 ) a 


Exemplo «.22. 


Exemplo «.23. 
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Definição «.24 (Multiplicação de matriz por escalar). Seja A uma matriz cujos elementos pertencem a 
um corpo F. Seja c € F um escalar. Então a multiplicação cA é igual à matriz obtida multiplicando cada 


elemento de A por c. + 
Exemplo «.25. Seja c = 3 e 
are o dijo DE 
E z o 
Então 
a-lo é y). 
i (x +45 ~) € 


Exemplo «.26. Damos um exemplo usando matrizes com elementos em C. Seja c = 3 + 2i e 


A y o 
23-2 
ANV 3+2i 2) 
É dm: 13 ü 


Definição «.27 (Multiplicação de matrizes). Sejam A uma matriz m x p e B uma matriz p x n. A multi- 
plicação de A por B, que denotamos AB é a matriz C, m x n, cujas entradas são 


Então 


o 
Cj = 3. Gio boj. + 
i=1 


Claramente, para que a multiplicação AB seja possível, o número de colunas de A deve ser igual ao 
número de colunas de B. Dizemos que neste caso A e B são compatíveis para multiplicação. Se A é m x p 
e B ép x n,o resultado será uma matriz m x n. 


AmxpBpxn = (AB)mxn- 


1 
=|m 
l 


3 
54 


Exemplo «.28. Multiplicamos uma matriz 3 x 3 por outra, 3 x 4, obtendo uma nova matriz 3 x 4. 


55 1 3 28859 20 20 26 54 
RO) |l 27207 2] =| 1 2H 0 
748/4001 -I 25 15 40 63 


Este exemplo destaca como cada elemento da nova matriz é calculado: o elemento na posição 2, 3 é calcu- 
lado usando a linha 2 e a coluna 3: 


c23 = q21b31 + a22b22 + d23b33 
= (0(9) + (MD + (MM =3 « 
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Exemplo «.29. Uma mariz multiplicada por um vetor coluna resulta em um vetor coluna com o mesmo 


número de linhas da matriz. 
1 0 3 
EO) 
3 —2 —1 


O mesmo acontece quando um vetor linha é multiplicado por uma matriz - o resultado é um vetor linha 
com o mesmo número de colunas da matriz. « 


Exemplo «.30. O produto de linha por coluna de mesmo tamanho sempre resulta em uma matriz com um 
único elemento: 


No entanto, a multiplicação de vetor coluna de tamanho m por vetor linha de tamanho n resulta em uma 


matriz m x n: 
2 6 —4 
1] 3- —2)=| 3 —2 « 
— —3 a2 


A multiplicação de uma matriz pela identidade resulta na mesma matriz: AT = A. 


Teorema «.31. A operação de multiplicação de matrizes é associativa e distributiva: A(BC) = (AB)Ce A(B + 
C) = AB + AC, desde que AB e AC sejam definidos. 


Demonstração. Quanto à distributividade: suponha, sem perda de generalidade, que A é m x p, e que Be 


C sejam p x n. Sejam D = A(B + C) e E = AB+4 AC. Então o elemento na posição i,j de F é igual ao 
elemento na mesma posição de E: 


p 
dij => aiplbp; + Cp) 


p 
ad 2 (Qipbpj + QipCpj) 


P p 
= E dipbpj + > GipCpj 
= EA 


= eij. E 


É importante observar, no entanto, que o produto de matrizes não é comutativo. Mesmo quando os 
produtos AB e BA são bem definidos (ou seja, ambas são quadradas e tem a mesma ordem), pode ser que 


AB BA. Por exemplo, sejam 
A= 12 B= 0 31. 
dd 0)’ —1 2 


as- (2 7) Ba = (13 DE 
0 3)’ -3 —2 


Então 
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Definição «.32 (Potência de matriz). Se A é uma matriz quadrada, então para qualquer inteiro n > 0, 
denotamos 


n— 
multiplicações 
— 


AP=AA...aA. 
Também definimos que A? = Z. + 


Exemplo «.33. Seja 


Então 


Quando A = A? (e portanto A = A” para todo inteiro n > 0), dizemos que A é idempotente. 


Exemplo «.34. A matriz zero e a matriz identidade são idempotentes. « 


2 -24 
-13 4 
l2 —3 
é idempotente, porque 


> 2 2, =4 2 —2 —4 2 —2 —4 
Ped-|-1 3 4M-1 3 4,401 3 4 < 
1-2 53 1 -2 -4 1 —2 —3 


Definição «.36 (Transposta). A transposta de uma matriz é a matriz onde o elemento na posição i,j é aji, 
ou seja, a matriz onde a i-ésima linha passa a ser a i-ésima coluna. Denota-se a transposta de A por AT. 4 


Exemplo «.35. A matriz 


Alguns textos podem também usar a notação A’ para transposta. 
A=[0 0 1) 
234 
02 
A! = (o ;) «4 
14 


Há alguns fatos evidentes a respeito da transposta: 


Exemplo «.37. Atransposta de 


* Atransposta de um vetor coluna é um vetor linha e a de um vetor linha é um vetor coluna. 
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* A operação de transposição é bijetora. 

* A função inversa da transposição é ela mesma: (AT)! = A, 

* A transposição é distributiva sobre a soma de matrizes: (A + B)! = A! + BI. 
e (CA)! = c(AT), para todo escalar c. 


O efeito da transposição no produto de duas matrizes já não é imediatamente evidente. O Exercício 
pede a demonstração do teorema a seguir. 


Teorema «.38. Para matrizes A e B tais que o produto AB seja definido, (AB)! = BT AT, 


Definição «.39 (Inversão de matriz). Seja A uma matriz quadrada. Se existe B tal que AB = BA = 7, 
então dizemos que A e B são inversas uma da outra. Denota-se a inversa de uma matriz M por M-!. 4 


Exemplo «.40. Seja 


Então 


porque 


SENER - 
1 0 2 3 01 


Para calcular a inversa de uma matriz A n x n, pode-se escrever AAT! = Z, tendo os elementos de 
AT! como incógnitas. Isso resulta em um sistema linear com n? equações e n? variáveis. 


Exemplo «.41. Neste exemplo mostramos como calcular a inversa da matriz apresentada no exemplo[o..40] 


Gate) 


Naturalmente surge um sistema linear: 


a+2c=1 
b+2d=0 
a+0c=0 
b+0d=1 
A solução para este sistema é 

a=0, =]; 
1 1 

=E d=—5; 


portanto 
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Teorema «.42. Se A e B são matrizes invertíveisn x n, AB é invertível, e (AB)! = BIA], 
Demonstração. Se A e B tem inversas A”! e B”!, então simplesmente verificamos que 


(AB)(BT!AT!) = A(BB DA”! 


&.3 Aplicações 


&x.3.1 Circuitos elétricos | sistemas lineares |] 


A lei de Kirchoff determina que em qualquer circuito fechado em um circuito elétrico, a soma diferenças 
de potencial é zero. Considere, por exemplo, o circuito a seguir. 


— AAA | 


R2 
100 Q 60V 
R1 R3 R5 
5100 2200 5100 
R4 R6 
500 100 O 


R7 R8 
2200 500 


B2 
20V 


Damos os nomes i1, iz, iz € i4 às correntes em quatro ciclos: 


ij :R1, R2, R3, R4 
iz :R3, B1, R5, R6 
is :R7, R4, R8, B2 
iu :R8, R6, R9, R10 


&.3. APLICAÇÕES 463 


Suponha que as correntes estão todas no sentido horário (se não estiverem, obteremos resultado negativo, 
nos indicando o sentido da corrente). 
Para determinarmos as correntes, resolvemos o seguinte sistema: 


(510 + 100 + 220 +50 
—30 + (510 + 100 + 220 
—20 + (220 + 50 +50 
(50 + 100 + 220 + 100 


— 


ii —220i2 — 50i; =0 
i2 — 220i; — 100i4 = 
i —50i —50i4 = 
i4 — 50i — 1001) =0 


ET A 


— 


ou, simplificando, 


880i; — 2201» — 50i3 =0 
—220i; + 830% — 100i4 = 60 
—50i] + 320i; — 50i4 = 20` 


100i2 50iz + 470i4 = O 
Após resolver o sistema, obtemos: 


ių = 0.024428726007575 
i2 = 0.081759905888709 
iz = 0.070201991822999 
i4 = 0.024864021659619 


Como usamos Volts e Ohms no circuito, as correntes são todas em Ampère. 


«.3.2 Balanceamento de equações químicas [ sistemas lineares | 
É possível produzir amônia a partir de nitrogênio e hidrogênio, como mostrado na equação a seguir. 
N2 + H2 > NH3 


No entanto, as proporções de nitrogênio, hidrogênio e amônia não estão representadas corretamente: à 
esquerda, temos uma molécula de cada gás, com dois átomos de nitrogênio e dois de hidrogênio. à direita, 
uma molécula de amônia, com um átomo de nitrogênio e tres de hidrogênio. Podemos balancear esta equa- 
ção para que represente as quantidades corretas dos reagentes, multiplicamos a quantidade de moléculas 
de amônia por 2. 

No + Ho > 2NH3 


Agora a quantidade de nitrogênio está balanceada, mas há tres vezes mais hidrogênio à direita do que à 
esquerda. Multiplicamos a quantidade de H2 por tres, e obtemos a equação balanceada: 


N2 + 3H, > 2NH3 


Quando há muitos elementos a balancear, torna-se impossível realizar o trabalho usando apenas a intuição. 
Damos um exemplo ainda pequeno, mas um pouco mais interessante que o anterior, apenas para ilustrar 
o processo. Suponha que queiramos balancear equação a seguir, que representa a reação de redução onde 
hidróxido de sódio e ácido sulfúrico tornam-se sulfato de sódio e água: 


NaOH + H2504 > NazSO4 + H20. 
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Denominamos as quantidades das moléculas de x1, x2, X3 e x4: 
(x1)NaOH + (x2)H2S504 > (x3)NazSO4 + (x4)H20. 


Agora, sabemos que as quantidades de átomos de cada elemento não podem se alterar com a reação. Assim, 
a quantidade de átomos de Oxigenio no lado esquerdo (que é igual a x, + 4x2) deve ser a mesma do lado 
direito (igual a 4x3 + x4). Seguindo este raciocínio para cada um dos quatro elementos da reação, temos 


X1 = 2x3 Na 

x1 + 4x2 = 4x3 + X4 (0) 

x1 + 2x2 = 2x4 N 
X2 AK3 S 


Este sistema tem infinitas soluções, da forma 


X1 = X4 
X2 = X3 
xı = 2x2 


Escolhemos x2 = 1 e temos a equação balanceada: 


2NaOH + H,5S04 > NasS04 + 2H20 


&.3.3 Cadeias de Markov | matrizes | 


Suponha que um sistema qualquer possa ficar em um dentre n estados diferentes, que o sistema muda de 
estado periodicamente com determinadas probabilidades, e que a pobabilidade de mudança de um estado 
para o próximo só dependa do estado atual. 


Exemplo «.43. Por exemplo, um paciente pode estar em n diferentes estágios de uma doença. Suponha 
que o paciente não esteja sendo tratado (porque não existe tratamento, ou porque não está disponível). Ba- 
seado em frequências de casos anteriores, um médico pode determinar a probabilidade do próximo estado 
do paciente, dado o estado atual. < 


Exemplo «.44. Máquinas em operação em uma fábrica tem certa probabilidade de apresentar tres tipos de 
falha a cada dia. A presença de uma falha aumenta a probabilidade de ocorrer outro tipo de falha, portanto 
a probabilidade de que as outra falhas ocorram depende do estado atual. < 


Quando o próximo estado de um sistema depende apenas do estado atual, dizemos que vale para ele a 
propriedade de Markov. 


Definição «.45 (Cadeia de Markov). Uma cadeia de Markoilé um processo que pode ser descrito por vários 
estados, com probabilidades de transição bem definidas entre os estados, para o qual vale a propriedade 
de Markov: a probabilidade de que o próximo estado seja s’ depende somente do estado atual, s, e da 
probabilidade de transição de s para s”. + 


lEsta definição é simplificada. 
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Usamos matrizes para representar as probabilidades de mudança de estado em uma cadeia de Markov: 
o sistema passará do estado i para o estado j com probabilidade pij. 
Suponha que a matriz de probabilidade de mudança de estado seja 


Pim P12 P13 
P= | P21 P22 P23 
P31 P32 P33 


Se calcularmos P teremos, por exemplo, na posição p21, 
Pp = P23p31 +P22P21 + P21P11, 
que é a probabilidade de o sistema começar no estado 2 e terminar no estado 1 após dois estágios: 
* p23p31, passando de 2 para 3 e de 3 para 1; 
* P22p21, permanecendo em 2, e depois passando de 2 para 1; 


* P21p11, passando de 2 para 1 e depois permanecendo em 1. 


De maneira geral, a posição pij na matriz P* dará a probabilidade de o sistema começad no estado i e 
mudar, após k estágios, para o estado j. Para calcular as probabilidades de mudança de estado após vários 
estágios, portanto, calculamos uma potência da matriz. 

Por exemplo, suponha que as probabilidades sejam dadas por 


0.2 04 04 
P= |01 0.8 0.1 
0.5 0.2 0.3 
Então após a troca de estados temos 


2 0.28 0.48 0.24 
P= 410.15 0.7 0.15)» 
0.27 0.42 0.31 
e na segunda troca de estados, 
0.175 0.650 0.175 
0.251 0.506 0.243 


E a probabilidade do sistema mudar, depois de duas trocas de estadd?] do estado 3 para o estado 2 é 0.506. 
Cadeias de Markov são normalmente abordadas em cursos versando sobre Probabilidade e Processos 


Estocásticos. O livro de Robert Ash [Asho8], por exemplo, é uma introdução à Probabilidade com um Capí- 
tulo sobre Cadeias de Markov. 


(oi 0.544 0173) 


2Na verdade pode-se calcular também o limite da potência Pk quando k — oo. Para esta matriz, obteremos 


0.2 0.6 0.2 
lim P= |0.2 0.6 02]. 


0.2 0.6 0.2 
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&.3.4 Sistemas de Votação [ matrizes ] 


É muito conhecido o sistema de votação onde cada eleitor escolhe um candidato, e o candidato que obtiver 
mais votos é declarado o vencedor da eleição. Este, no entanto, não é o único sistema de votação, e são 
conhecidos diversos problemas com este sistema - um deles é a possibilidade de se eleger um candidato 
que não é a preferencia da maioria, e que com a mais alta rejeição dentro todos os candidatos. Isto fica 
mais claro com um exemplo. 


Exemplo «.46. Há dez candidatos em uma eleição, c1, c2,..., €10, € mil eleitores, e1, e2,..., e1000- 
Suponha que os votos tenham sido como na tabela a seguir. 


candidato | votos candidato | votos 
cı | 280 ce | 50 
c2 | 110 cz | 55 
c3 | 90 cs | 85 
c4 | 100 co | 90 
c5 | 70 cio | 70 


Claramente, cy venceu a eleição de acordo com os critérios definidos (ele tem a maior quantidade absoluta 
de votos). No entanto, ele não é a preferencia da maioria, porque há 720 candidatos que não votaram nele, 
e é possível que dentre esses 720, a rejeição de c1 seja altíssima. < 


O Marquês de Condorcet desenvolveu um método alternativo de votação, que permite escolher o can- 
didato com a menor rejeição dentro todos. 

Cada eleitor, ao invés de escolher um candidato, determina uma ordem de preferência entre todos os 
candidatos. Assim, um voto poderia ser 


(c2, €10, C8, C3, C1, C4, C7, C5; C6, C9), 


representando a escolha “minha primeira opção é c2; a segunda, c10,..., e minha última opção é co”. Neste 
caso, contabilizamos nove vitória de c2 (uma sobre cada um dos outros candidatos); oito vitórias de c10 
(uma sobre cada um dos candidatos à sua direita no voto), e assim por diante. 

Vence o candidato que tiver o maior número de vitórias sobre outros, quando considerados par-a-par. 

Uma maneira simples de realizar a apuração de eleições deste tipo é representar os votos como matri- 
zes: cada eleitod e; envia, em sua cédula (supostamente eletrônica), uma matriz Ai. As matrizes A; são 
quadradas, e suas linhas e colunas representam os candidatos. O eleitor marcará +1 na posição A (;,;) se 
preferir o candidato c; ao candidato c;, e O caso contrário. A matriz a seguir, por exemplo, é um voto para 
uma eleição com tres candidatos (a diagonal não importa, porque não comparamos um candidato com ele 
mesmo). 


Na linha 1, vemos que o candidato prefere cy a c3, mas prefere cz a c1. A matriz, portanto, representa o 
voto 
(c2,c1,c3). 


Para calcular o total de votos, simplesmente somamos as matrizes, 


T=) A 
i 
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A matriz T conterá, na posição T,; ;,, a quantidade de eleitores que preferem c; a c;. Olhando para T, 
(ij) p j p 
podemos comparar os candidatos dois a dois e declarar o vencedor. Por exemplo, se tivermos os votos 


+1 0 0 + 0 + 0 0 0 +1 
0 a) , (a (0) ) , (n 1) , [+ A) , (a t) , 
+1 0 0 + 0o o0 +1 0 0 0 
a soma das matrizes será 
+1 43 
T= (= $3) 
+2 bi 


Agora, para cada par de candidatos ci, cj, verificamos se Ti; > Tji. Se for, é porque i ganha de j. Assim, 
temos: 


e Tiz < T21, por isso c2 vence c1 
* Tiz > T31, por isso cy vence c3 
* T23 > T32, por isso c2 vence c3 


Temos então duas vitórias para c2, uma para cy e nenhuma para c3. O candidato cz é vencedor. 

O sistema de votação de Condorcet também apresenta problemas: é possível que não seja possível de- 
clarar um vencedor, por exemplo. Apesar disso, é usado por diversos grupos de pessoas. 

Uma grande quantidade de sistemas de votação são discutidos, por exemplo, nos livros de Kenneth 


Arrow} |[ASSO2][ASS10] e de Duncan Black [Blas8). 


Exercícios 


Ex. 319 — Resolva os sistemas lineares: 


2x1 — 3x2 + X3 — x4 =8 


X1 — X2 =4 
3x1 — 2x2 + x3 =0 xı + 2x2 + x4=9 
(a) (b) x2 +x3=8 (c) 
xı + x2—5x3 = x2 + X3 = 
+x] +x3=3 
3x1 + 4x2 — x3— 5x4 = —7 
2x — x2— x3=0 3x + x2— x3 = —2xı + x2— x3=1 
(d)4 xı +3xz 7x3 =1 (e) 2x2 +2x3 = 2 (f) 5x1 6x2 + 3x3 = —5 
6x1 + 4x2 + 12x3 = 2 3x1 — 4x2 — x3=3 6x1 — 10x2 + 4x3 = 7 


Ex. 320 — Seja 


x 2 1 
A=|0 0 0)» 
2x1 
com x €E R. Determine B tal que AB seja triangular superior. 


Ex. 321 — Dê exemplos de matrizes 2 x 2 idempotentes, diferentes da identidade e da matriz zero. 


*Kenneth Arrow ganhou o prêmio Nobel por seu trabalho em sistemas de escolha. 
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Ex. 322 — Determine a real tal que 


tenha inversa. 


Ex. 323 — Seja 


~=(1 3) 


Determine uma fórmula para a matriz A”, para qualquer n natural. 
Ex. 324 — Prove a parte que falta do Teorema[0.31] 


Ex. 325 — Prove o Teoremal[0.38] 


Ex. 326 — Mostre como usar multiplicação de matrizes 2 x 2 para realizar soma de inteiros. Para isto, 
exiba uma família de matrizes 2 x 2 com a seguinte propriedade: há uma posição fixa nas matrizes que 
representa o número a ser somado. Se a matriz À contém x naquela posição e B contém y, então AB terá 
x+y ali. 


Ex. 327 — Se quisermos dobrar a corrente i; do circuito elétrico em nosso exemplo modificando apenas a 
bateria B2 por uma outra bateria B3, qual deveria ser a diferença de potencial entre os pólos de B3? Quais 
passariam a ser os valores das outras correntes (iz, i3, i4)? 


Ex. 328 — Se tomarmos um circuito elétrico qualquer formado por resistores e baterias apenas, e deter- 
minarmos uma equação descrevendo a corrente em cada ciclo fechado, como fizemos no exemplo neste 
Capítulo, é possível obter um sistema incompatível? Indeterminado? Explique porque sim ou porque não. 


Ex. 329 — Balanceie: 
a) Fe + Cl > FeCl; 


b) KMnO; + HCI = KCL + MnCl + H,0 + Cb 
c) PhCH; + KMnO; + H2S04 = PhACOOH + K;SO4 + MnSO, + H20 


Ex. 330 — Quando descrevemos o uso de matrizes no sistema de votação usando o critério de Condorcet, 
usamos entradas +1 para “prefere” e O para “não prefere”. Se tivéssemos usado +1 e —1 - ou, de maneira 
mais geral, +k e —k, para k € N, o sistema ainda funcionaria? 


Apêndice À 


Indução Finita 


A técnica de demonstração por indução finita é usada algumas vezes no texto. Este Apêndice desenvolve 
brevemente esta ferramenta, ilustrando seu uso em alguns exemplos. Apenas a forma fraca de indução é 
abordada, porque somente ela é usada no texto. Mostramos também como usar indução em objetos não- 
numéricos, como matrizes. 


B.1 Enunciado do Princípio da Indução Finita 


Usamos indução finita para demonstrar fatos a respeito dos números naturais. Por exemplo, 
* Todo número natural pode ser decomposto em fatores primos. 
* Para todo número natural n > 2,2n < 27, 
* Para todo número natural n, 5) ;i=n(n+1)/2 
são todas predicados P(n): 
* P(n) =“n pode ser decomposto em fatores primos” 
e P(n) =“2n< 2™” 
“And p i= n(n + DARE 


Informalmente, o princípio da indução finita é frequentemente comparado a um dominó. Quando quere- 
mos provar que alguma afirmação é verdadeira para todo número natural, o princípio da indução finita 
consiste em 

i) Provar que a afirmação é verdadeira para o primeiro número (zero, um, ou algum outro); 


ii) Provar que, se a afirmação vale para um natural k, então ela deve valer para k + 1. 


Damos um exemplo trivial. Suponha que a afirmação que queiramos demonstrar é “para todo n > 3, 
2n < 2™”, Faremos a demonstração por indução em n. 
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Provamos primeiro que 
2(3) < 23, 
o que é óbvio. A este primeiro caso chamamos de base de indução. 
Agora presumimos que a afirmação vale para k: 


2k < 28 


A este pressuposto chamamos hipótese de indução. 
Finalmente, executamos o passo de indução: provamos que a afirmação também vale para k + 1, usando 
nossa hipótese (de que vale para k): 


28+1 = 2(2¥) 
=2 + M 
> 2 +64 (25 > 2, para k > 3) 
>2+2k (2* > 2k, pela hipótese!) 
=P). 


Assim, mostramos que se 2* > 2k, então 25+! > 2(k + 1). Isto termina nossa demonstração. 
Conceitualmente, a indução funciona porque demonstramos um primeiro caso (para n = 3) e depois 
provamos uma implicação que “amarra” todos os outros casos maiores que tres: 


2(3) < 23 (base) 
2(4) < 2º (porque 2(3) < 2? = 2(4) < 2º) 
25g 27 (porque 2(4) < 2? > 2(5) < 2º) 
2(n) <2” (porque 2(n — 1) < 2™=! => 2(n) < 2”) 


Formalizamos agora o princípio da indução finita. 


(Princípio da Indução Finita - “indução fraca”). Seja p(n) um predicado a respeito de números naturais 
(ou seja, n € N é argumento do predicado). Se 


i) p(no) é verdadeiro para algum no € N; 
ii) se para qualquer natural k > no, a veracidade de p(k) implica na veracidade de p(k + 1); 


então p(n) é verdadeiro para todo natural n > no. 
O item (i) é chamado de base de indução. Quando presumimos que p(k) vale, esta é nossa hipótese de 
indução. Ao mostrarmos que p(k) implica em p(k + 1), executamos o passo de indução. © 


Há uma segunda forma do princípio da indução finita, mais conveniente em algumas situações. Pode 
ser eventualmente mais fácil provar que “se a proposição vale para todo número menor que n, então vale 
para n”. 
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Por exemplo, se quisermos demonstrar que Fn < 2” (onde Fn é o n-ésimo númerode Fibonacci), ob- 
servamos que Fn é definido usando não apenas Fn—1, mas Fn—2 também. Assim, provamos a base com dois 
casos: 


Fo = 0 < 2° 
E=1<2! 


Lu 


A hipótese de indução é “para todo k < n, Fk < 25”. Para realizar o passo, usamos a hipótese para mostrar 
que Fn < 2”: 


Fn = Fai + Fn 
e nen dean grs (pela hipótese, Fn—1 < 271, Fn—2 < 272) 
gap edi ds A 
Dn 
= 


E assim concluímos a demonstração. 


(Princípio da Indução Finita - “indução forte”). Seja p(n) um predicado a respeito de números naturais 
(ou seja, n € N é argumento do predicado). Se 


i) p(no) é verdadeiro para algum no € N; 


ii) se para qualquer natural k > no,a veracidade de p(1), p(2),..., p(k) (todos!) implica na veracidade 
dep(k + 1); 
então p(n) é verdadeiro para todo natural n > no. © 


Nas próximas seções damos alguns exemplos de demonstração por indução. A divisão das seções não 
implica que estas são as únicas áreas ou os únicos modos de usar indução. 


B.2 Demonstrações de igualdades e desigualdades simples 


Exemplo ß.1. Demonstramos por indução a seguinte proposição: 
2” < n! para todo n > 0. 
i) Base: 2! > 1! 
ii) Hipótese: 2* < k! 


iii) Passo: Queremos mostrar que, presumindo que se a hipótese de indução vale, temos 2*+! < (k+1)!. 
O passo é detalhado a seguir. 


< 2(k!) (usamos a hipótese de indução) 
< (k+ D(k!) (2 < k+ 1, porque k > 0) 
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Desta forma, demonstramos a proposição. < 


Exemplo ß.2. Provamos agora que todo número natural maior que um é divisível por algum primo, usando 
a segunda forma do princípio da indução finita. 


i) Base: 2 é divisível por si mesmo, e 2 é primo, portanto a afirmação vale para 2 
ii) Hipótese: “Todo número natural k < n é divisível por algum primo”, 
iii) Passo: Agora consideramos o número n. Há duas possibilidades: 


a) Sen é primo, ele é divisível por si mesmo (um primo). 


b) sem não é primo, então ele é divisível por dois outros números menores que ele. Mas estes 
dois outros números, pela hipótese de indução, são divisíveis por primos, e concluímos que n 
é divisível por algum primo. < 


Exemplo ß.3. Demonstramos a seguir que para qualquer n > 0, 


2+2 A2.. = PAIO), 


i) Base: para n = 1, temos? = 2? — 2, 
ii) Hipótese: 2 +2? +2? +... 42k=92h+ 2, 
iii) Passo: Queremos mostrar que, presumindo que se a hipótese de indução vale, temos 
24242 4...49M1] — 2k+1+1 =: 
O passo é detalhado a seguir. 


242 pp HA gh = (2422 +... +28) 4,288 


= (2Ny — 2) Pia (usamos a hipótese de indução) 
= Morto —2 
Et? 2, 

Provamos assim a proposição. < 


Exemplo ß.4. Mostramos neste exemplo que 9” — 2” é divisível por 7 para todo inteiro positivo n. 
i) Base: para n = 1, temostrivialmente9 — 2 = 7, 
ii) Hipótese: 9* — 2K = 7q para algum q natural. 


iii) Passo: 


e portanto 7 divide 9K+! — 2k+1 Isto conclui a demonstração. 
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< 


Exemplo ß.5. Neste exemplo usamos a segunda forma do princípio da indução para mostrar que notas de 
$3, e $7 são suficientes para compor qualquer quantia acima de $12. 


i) Base: mostramos inicialmente que podemos compor 12, 13 e 14 com estas notas. 
Paran = 12, temos trivialmente 3 + 3 + 3 +3 = 12. 
Para n = 13, temos 7 +3 +3 = 13. 
Paran = 14, temos 7 + 7 = 14 


ii) Hipótese: presumimos que todo valor 12 < k < n pode ser composto por notas de 3 e de 7. 


iii) Passo: Queremos agora mostrar quen > 15também pode ser composto por tais notas. Como n—3 < 
nen > 15, podemos compor n — 3 e adicionar uma nota de 3, terminando a demonstração. < 


Exemplo ß.6. Mostramos agora que se sen(x) Æ 0, então para todo n € N, 


in 
(cosx)(cos 2x)(cos 4x) -- : (cos 2"! x) = Ga E E 
2" sinx 
i) Base: Paran = 1, temos 
das sen(2x) 
2sen(x) 
que segue naturalmente de que sen(2x) = 2 sen(x) cos(x). 
ii) Hipótese Presumimos que a proposição vale para k, ou seja, 
2K 
(cos x)(cos 2x) (cos 4x): -- (cos 2571x) = Sica ; 
2K senx 


iii) Passo: Para chegar na forma válida para k + 1 é interessante mudar um dos lados da equação da hipótese 
de forma que fique já como queiramos, assim tomamos a hipótese e multiplicamos os dois lados por 
cos(2*x): 


2k 2k% 
(cos x) (cos 2x} (cos 4x) - - - (cos 28x) = sen 2 “x cos(2 x) 


2* senx 
O numerador da fração no lado direito 
2K41 
sen2'xcos(2*x) = pen 2 5 
logo temos 
(=) 
2 
(cos x) (cos 2x) (cos 4x) - <- (cos 25x) = +—— A 
2k sen(x) 
— sen(2%+!x) 
— MI sen(x)? 
e terminamos a demonstração, porque esta é a forma da proposição para k + 1. < 


Isen(a) cos(b) = 5 [sen(a +b) + sen(a — b)]. 
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Exemplo 2.7. A função B é definida como 


1 
Blab) = | xet at ax 


para a,b € R$. 
Provamos agora que para um y real qualquer e n natural, B (n, y) = (n)/(y+D(y+2)---(y+n+1), 
ou seja, 


1 | 
hi espa a n! 
ko de= TE E A) ty En SA 


Demonstramos por indução em n. 


i) Base: para n = 0, 


1 1 0! 
| xº(1— x)”dx = = 
0 y+1 y+0+1 


ii) Hipótese: presumimos que a igualdade vale para n — 1: 


JAER (n—1)! 
n—1 Wu Z 
j E en ES RES Th 


iii) Passo: calculamos o valor para n. Integrando por partes e usando 


chegamos a 
1 no quan! 1 
[etica = * U ep pal | ra — xt dx 
o y+] o V+HIJ 
1 
04 | x" (1 mv dx 
v+1J 
EP; ( ral)! ) (pela hipótese de indução) 
VAI (WD y +n) ci 
n! 
+I? (yu +n+ 1) 
o que conclui a demonstração. « 


B.3 Indução dupla 


Podemos também usar indução dupla, quando tivermos uma proposição P(m, n) a ser demonstrada. 
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Exemplo 9.8. Seja f uma função de dois argumentos inteiros, definida a seguir: 
(1,1) =2 
fim +1,n) = f(m, n) +2(m +n) 
flm, n +1) = f(m, n)+2(m+n- 1) 


Provaremos que para m,n > 1, 
f(m, n) = (m+n)? — (m +n) — 2n +2. 
i) Base: 
(1 +1)}2-(1+1—2(1)+2=22?—2—2+2 
=2 
= f(1,1) 
ii) Passo (m): Nossa hipótese é de que para qualquer n fixo, 
f(m—=1,n) =(m— 1 +n)? —(m=1 +n) —2n +2. 
Agora calculamos f(m, n), usando a hipótese: 


f(m, n) = f(lm — 1] +1,n) 
= f(m—1,n)+2(m—1+n) 
= f(m- 1,n)+2m—2+2n 


= ((m 1+n)}}-—(m-1+n) 2n+2)+2m—2+2n (hipótese de indução) 
(m—1+n)?—(m—-1+n}+2m 
( 2tim-n+1 
= (m? +n? +2mn — 2n— 2m +1)+m-n+1 
( 
( 


m=1+n) 


)?—2n—-2m+m+n+2 
+n)? — (m+n) +2. 


m+n 


E demonstramos o passo para a variável m. 


iii) Passo (n): Nosas hipótese é de que para qualquer m fixo, 


tits 1) = (m+n 1)? — (m+n -—1)—2(n—1) +2. 
calculamos f(m, n), usando a hipótese. 


f(m, n) = f(m, n — 1] + 1) 
= f(m, n —1]) +2(m + In — 1] — 1) 
f(m, [n — 1]) +2m + 2n — 4 


(m+n=1)}- (m+n 1)—2(n 1)+2)+2m+2n—4 
(hipótese de indução) 


476 APÊNDICE B. INDUÇÃO FINITA 


=(m+n-1)} -m-n+1—2n—2+2+2m+2n—4 
=(m+n-1)}} +m-n-3 
= (m? +n? +2mn—2n—-2m+1)+m-n-3 
=m? +n? +2mn — (n+m)—2 
=(m+n} —(m+n)+2 
Desta forma, usando passos separados para m e n, mostramos a validade da fórmula. < 


B.4 Indução em estruturas 


Exemplo ß.9. Definimos informalmente neste exemplo as árvores. Para uma definição mais formal veja 
no capítulo um o exemplo [1.41](pág/20), e observe que uma árvore é um grafo onde não há ciclos e onde 
qualquer vértice á alcançavel por outros por arestas. 

Uma árvore é um conjunto de vértices, que representamos graficamente como pontos, e um conjunto 
de arestas, que repersentamos graficamente como linhas ligando estes pontos. 

A figura a seguir mostra uma árvore. 


Os nós (vértivces) da árvore são a, b, c, d, e, 7. 

Uma árvore é chamada de binária se cada nó tem exatamente um ou tres vizinhos - como é o caso deste 
exemplo. Um nó que só tem um vizinho é chamado de folha. As folhas da árvore na figura são c, d, e. 

Em uma árvore, normalmente marcamos um vértice “especial” e o chamamos de raiz. 

Provaremos que em qualquer árvore binária, v = e + 1, onde v é o número de vértices e e é o número 
de arestas. 


i) Base: Um único vértice isolado é uma árvore binária. Temos v = e + 1,jáquev = 1ee =0. 


ii) Hipótese: Presumimos que a proposição vale para v, ou seja, uma árvore com v vérticestem v = e+ 1 
vértices 


iii) Passo: Tome uma árvore qualquer com v’ = v+ 1 vértices. (Denotaremos os vértices e arestas desta 
nova árvore por v’ e e’). 


Retiramos uma folha da árvore. Necessariamente, retiramos também uma aresta. 
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B.5 


O resultado é uma árvore com v vértices, e portanto com e = v — 1 arestas. Ao recolocar o vértice e 
arestas removidos, temos v’ = v + 1 vértices e e’ = v arestas. Logo, 


v'=e'4+1. 


Como este procedimento vale paar qualquer árvore com v + 1 vértices, a demonstração está con- 
cluída. < 


Indução em Geometria 


Exemplo ß.10. Provaremos que o número de regiões definidas por n retas no plano, sendo que não há 
retas paralelas e não há mais de duas retas se interceptando no mesmo ponto, é 


i) 


ii) 


ii) 


n? +n 
2 


+1. 


Base: com nenhuma linha, temos uma única região, e 


02° +0 
2 


+1=1, 
logo a proposição é válida para zero linhas. 
Hipótese: suponha que com n linhas dividimos o plano em no máximo 


nê +n 


1 
7 + 


regiões. 

. . . . . 2 e~ . . 
Passo: suponha que o plano tenha sido dividido por n linhas em ES? + 1 regiões. Ao adicionar 
an + 1-ésima linha, ela deverá cruzar com todas as outras (senão haveria linhas paralelas), e estes 
cruzamentos são todos distintos (senão haveria pontos com mais de duas linhas se cruzando). 
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Estes novos cruzamentos dividem portanto a nova linha em k + 1 segmentos, cada um destes seg- 
2 e~m . . e . 
mentos em uma das "+" + 1 regiões formadas anteriormente, como ilustra a figura a seguir para 


o casd’ļem que k = 3 (a estrela marca a região E2). 


Cada um destes segmentos divide sua região em duas, e portanto adicionamos k + 1 regiões. Temos 
portanto 
n? +n 
2 


regiões. Rearranjando a expressão, vemos que temos 


+1+(n+1) 


(n+1)2+(n+1) 


H1 
2 


regiões - que é a forma que queríamos para n + 1. « 


Exemplo 2.11. Provaremos que o número de diagonais em um polígono convexo com n lados é 


n(n—3) 
2 , 


quandon > 3. 


i) Base: Um triângulo tem tres lados e nenhuma diagonal. A fórmula está correta para triangulos, já 
que 
n(n—3) 3(3-3) 0 


N 2º “270 


CN SE ng P =3) dá 
ii) Hipótese: Presumimos que todo polígono convexo com n lados tem nS diagonais. 


iii) Passo: Tome um polígono convexo qualquer con n + 1 lados. 


?A figura é ilustrativa, mas não é essencial para a demonstração, em especial porque trata somente do caso k = 3, e o argumento 
neste momento é de qualquer k para k + 1. 
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Escolha dois vértices A e B tais que, quando traçamos a diagonal AB, o polígono fica dividido em um 
triângulo e um outro polígono convexo com n lados. 


V3 Vn—2 


O polígono original, de n + 1 lados, tem todas as diagonais do polígono menor. Mas ele tem também: 


- A diagonal AB, que transformamos em aresta; 
- As n— 2 diagonais que incidem no vértice que foi isolado por AB. 


V3 Vn-2 


Vn+1 


Assim, a quantidade de diagonais do polígono com n + 1 lados é 


valor para n 


ae +1 +(n-—2)= wi +n- 1 


480 APÊNDICE B. INDUÇÃO FINITA 


n(n—-3)+2(n—1) 
2 
n? — 3n) + (2n — 2) 


exatamente a mesma fórmula, para n + 1. « 


B.6 Indução em número de operações com matriz 


Exemplo 3.12. Podemos usar indução finita também em demonstrações envolvendo matrizes. Mostrare- 
mos que 


i) Base: Paran = 1, trivialmente, 


ii) Hipótese: 


iii) Passo: Queremos mostrar que, presumindo que a hipótese de indução vale, temos 


k+1 
( 2 1) ada el k+2 e 
E Ri Aka A kal k 


Detalhamos portanto o passo. 


k+1 k 
E o (1) (A+ = AXA) 
10 +10) ADO 


= E RE) LA a E N (usamos a hipótese de indução) 
= k+2 k+1), após multiplicar 
fo O e) (ap plicar) 


Demonstramos, portanto, a proposição. 


3.7. INDUÇÃO EM ORDEM DE MATRIZ QUADRADA 481 


Na verdade, poderíamos ter demonstrado para qualquer n > 0, porque para qualquer matriz A, Aº = 
T. 
É vácil verificar também que o resultado vale para n < 0: basta multiplicar 


n+41 n)/-n+4] —n - (4 o). < 
—n -n+1 n n+41 01 


B.7 Indução em ordem de matriz quadrada 


Exemplo 2.13. Toda matriz quadrada A sem zeros na diagonal pode ser decomposta em BC, sendo B 
triangular inferior e C triangular superior. 
Procedemos por indução na ordem da matriz. 


i) Base: quando n = 1, temos À = (a), e A = (1)(a), trivialmente. 


ii) Hipótese: Presumimos que qualquer matriz quadrada X de ordem n — 1 pode ser decomposta em 
YZ, com Y triangular inferior e Z triangular superior. 


iii) Passo: Temos A de ordem n, que particionamos em blocos, separando a primeira linha e primeira 


coluna. 
A= (en » ; 
c R 


onde 1 é um vetor linha com n — 1 elementos; c é vetor coluna com n — 1 elementos; e R é uma 
matriz quadrada de ordem n — 1. Também supomos, usando a hipótese de indução que R = MN, com 
M triangular inferior e N triangular superior. 


Observe que podemos dividir pode a11, porque presumimos que A não tem zeros na diagonal. 


A matriz MN — a também pode ser decomposta em X e Y triangulares, da mesma forma, portanto 
seja 


XY = MN — rel, 


de forma que 


MN =XY + Lar. 


Sejam B e C definidas a seguir 


Temos então 


M [e +0 | saindo) 
e so to esa E 
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Assim, decompusemos A usando a decomposição de R, que era uma matriz de ordem n — 1. 


P.8 Demonstração de corretude de algoritmos 


É comum provar por indução que um algoritmo retorna o resultado correto. 


Exemplo 2.14. O seguinte algoritmo pode ser usado para elevar um número qualquer a uma potência 


natural:para calcular pot(b, k), 
e se k = O retorne 1 
e se ké ímpar retorne b - pot(b,k — 1) 
* se k é par, retorne b? . pot(b, k/2) 
A seguir demonstramos, por indução no expoente, que o algoritmo sempre calculará b*. 
* Base: para k = 0, algoritmo corretamente retorna 1. 
* Hipótese: presumimos que para todo k < n, pot(b, k) retorna corretamente b“. 
* Passo: Quando o algoritmo é usado para calcular b”, há duas possibilidades: 
i) né ímpar: 


pot(b,n) = bpot(b,n — 1) 
= bb™! (pela hipótese de indução) 


=b" 


ii) né par: 
pot(b, n) = b? pot(b,n/2) 
= b?b™/2 (pela hipótese de indução) 
= br 
4 


E com isto demonstramos que o algoritmo está correto. 
; E ba r doe A ; E 
Exemplo 3.15. Queremos determinar se um número binomial (7) é par ou ímpar; chamamos esta função 


de f(m, n), tal que 


PANE $ se (™) é par. 


f.8. DEMONSTRAÇÃO DE CORRETUDE DE ALGORITMOS 483 
Podemos calcular o número binomial e verificar o resto da divisão por dois. Para isto teríamos que com- 


putar 
mo. m! 
nj) n!(m-=n)! 


o 122. Beam 
n!1-2-3...(m—n)] 
mim—Dim-2-.-(m—n+1) 


n! 
mm Dm+Di(m—n+1) 
= 1.2.3...n ? 


realizando m — n — 1 multiplicações no numerador, n — 2 multiplicações no denominador (totalizando 


m — 3 multiplicações), uma divisão para obter o valor de (™) e mais uma divisão por dois para obter a 
paridade. 


Há uma maneira mais eficiente de determinar a paridade de números binomiais, necessitando apenas 
de 4|log; n] divisõef]por 2, e nenhuma multiplicação. 


Por exemplo, para (1 o) o primeiro método precisa de 1000001 — 3 = 999998 multiplicações, e o 


método que dscreveremos a seguir usa apenas 4|log, 2112) = 44 divisões. 
Suponha m, n €E N, e que a função f(m, n), é computada de acordo com o seguinte algoritmo: 


* sen = O retorne 1 
* senão, se m é par en ímpar, retorne O 
* senão, retorne f(|m/2], |n/2]) 


Damos dois exemplos de uso do algoritmo. Primeiro calculamos 


f(991, 12) = 1(495,6) 

= f(247,3) 

= f(123, 1) 

= (61,0) 

=1. (n=0) 
Realmente, 

(O = 1751905219023893762873161845, 

ímpar. 


Agora calculamos 


f(791,33) = (395, 16) 
(197, 8) 
( 
( 


98,4) 


f 
f 
f(49,2) 


*Em computadores, a divisão por dois pode ser implementada de maneira mais rápida que outras divisões e multiplicações. 
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= #(24,1) 
-0 (m par, n ímpar) 
De fato, 
E ) = 25538103034701028903784191930670086104508663600436238803720, 
par. 


Provaremos que este algoritmo calcula corretamente f(m, n). 
A demonstração não é em m ou em n, e sim na quantidade de repetições feitas pelo algoritmo. Presu- 
miremos que o algoritmo calcula corretamente a paridade para todos binomiais (R) comp<meq<n, 


e com isto provaremos que oa paridade de (™%) é calculada corretamente. 


i) Base: quando n = 0, o algoritmo retorna um. Isto está claramente correto, já que 
m 
(0) =" 


Ainda como parte da basae de indução, temos todos os casos em que m é par en ímpar, e algoritmo 
retorna zero determinando que (3) é par. Isto está correto, porque 


UE 


Como o lado direito é par, o esquerdo deve ser. Mas se k é ímpar, então (T') é par! 


ímpar. 


ii) Hipótese: presumimos que f(p, q) para retorna corretamente a paridade para (5); parap < m, 
q<n. 


iii) Passo: Como temos dois números naturais (m e n) envolvidos no passo, e estamos interessados na 
paridade do número binomial, faz sentido dividir a demonstração em quatro partes - uma para cada 
possível combinação de paridades de m e n: 


D f(2a,2b), ambos pares 
I) f(2a+1,2b) m ímpar, n par 
III) f(2a,2b+1) n par ,m ímpar 
IV) f(2a+1,2b+1) ambos ímpares 


Estes casos correspondem a dois pares, um ímpar e um par, um par e um ímpar, e dois ímpares. 
I) Neste caso temos m e n pares. Expandimos o coeficiente binomial (7): 
m\ m! 
nj) ni(m-n)! 
1.2.3...m 
n!.2-3...(m—n)] 
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mim 1)(m—2)---(m—=n+1) 


n! 


m(m-— 1)(m—2)---(m-=-n+1) 


Te ES ER 


(m-D(m-3).-:(m—-n+71) 


mim—2)(m—4).. 


(m—n+2) 


(m—-N(m-3)..-(m-n+1 


)( 


2-4.6.. 
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) 


oaao ho. pares e ímpares) 


mim—2)(m—4)... 


(m—-n+2 


J 


2(1) - 2(2) : 2(3)- -- 
(o denominador tem n/2 fatores pares; fatoramos o 2) 


2(n/2) 


) 


(m-D(m-3)..(m-n+] ) e “(m—n+ 
271-2.3---n/2 
(m—1)(m—3):---(m-n+1 25 -UZT -UAF = 2) -2 


3, 


)( 


271.2-3---n/2 
(o numerador tem n/2 pares; fatoramos o 2) 


Desa 


mondo ma) 23. $ (3—1) (3 
231.2.3...n/2 


524 2) 


( 
( 
Ga 
( 
( 
( 


Dr) 27 (=: HA2 2) 
1.3.5...(n—1) 23 1.2.3...n/2 
(m—1)(m-—3).---(m—=n +1) /m/2 

1-3-5- (n—1) e 


ímpar 


Como multiplicação por ímpar não muda a paridade de um número, então 


Ea tem a mesma paridade de E a ; 


Sendo ambos pares, temos 


[m/2] 


n/2 


=m/2 


In/2] =n/2. 


Usamos a hipótese de indução, que nos diz que o algoritmo calcula corretamente f( 


cluimos esta parte da demonstração. 


I) Temos m ímpar en par. Usaremos a identidade 


a 


nesta demonstração. Esta identidade implica que 


m/2,n/2), e con- 
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a Ganaan E hanla 


Também podemos usar a identidade 


para concluir que 


ma) 


Como m — n e m são ambos ímpares, 


— 1 
(1) tem a mesma paridade de (X ) ; 
n n 


Aplicamos o caso (1) na expressão do lado direito, e temos que 
m [(m — 1)/2] 
(1) tem a mesma paridade de ( |n/2] ; 


Como m é ímpar, |(m — 1)/2| é o mesmo que |m/2], e usamos a hipótese de indução, que nos 
diz que o algoritmo calcula corretamente f(m/2,n/2), para concluir que a paridade é calculada 
corretamente neste caso. 

II) este caso é trivial, porque é nossa base de indução. O algoritmo nunca chegaria a calcular 
f(|m/2], |n/2]) nete caso, porque teria terminado antes e retornado 0. 


IV) quando tanto m como n são ímpares, observamos que 


n() =n P) (B.1) 
n n—1 


Como m e n são ímpares, e a multiplicação por ímpar não altera a paridade de um número, 
; A 

temos que a paridade de (7™) é a mesma que a de (7). 

Agora, como m en são ímpares, 


n-1=2[n/2), 
temos que 
(7) tem a mesma paridade de o (por[B-1) 
(oG ) ) tem a mesma paridade de a 1) (por[B.2) 
2|m/2] ; |m/2] 
aah ) tem a mesma paridade de ( |n/2] ) (semelhante ao caso (1) 


Usamos novamente a hipótese de indução, ao presumir que o algoritmo calcula corretamente f(|m/2], |n/2]), 
para finalizar esta parte a damonstração. 


Concluímos aqui a prova de corretude do algoritmo. < 
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B.9 Indução para trás, com base infinita 
Uma outra forma de indução consiste em provar que o teorema é válido para uma quantidade infinita de 
números naturais (mas não para todos); e depois provar que se valepara n, vale paran — 1. 


Exemplo 2.16. Provaremos que a média geométrica de n números positivos é sempre menor que a média 
aritmética. 
A prova será feita da seguinte maneira: 


Base (I): provaremos que o teorema vale para dois números; 
Base (Il): provaremos por indução que o teoerma vale para 2* números; 


Passo: provaremos por indução para trás que se o teorema vale para todo natural- ou seja, se vale para k, 
então vale para k — 1. 


Note que provaremos uma base infinita (que neste caso consiste nas potencias de dois): 


0 © e e e E 


0 


e depois faremos indução “para trás”. 


e. o e e 
e e e e— e 
0 


Seja n um número natural qualquer. Certamente há uma potência de dois mairo que n (por exemplo, 
2”, Como a base nos garante que o teorema vale para 2”, e o passo garante que vale para todo número 
menor que 2”, vale para n. 


i) Base (I): Paran = 2, partimos do enunciado do teorema para chegar a uma tautologia: 


ma +y? Dy 

x? + 2xy +y? > 4xy 

x? —2xy +y? > 0 
(x-y) >0 


Como (x — y)? é > 0 para quaisquer x e y, provamos o caso n = 2. 


ii) Base (II): 


a + a2 +... F dox+ 1T/a+a+...+ ax d2x4,7 + dox,2 +... + aA2x+1 
= | 
2k+1 ER) 2k ! 2k 
1 
> 2 ( 2%) a102: Ak + ABN Q2x4+1Q2kx4+2':: azko ) 


(hipótese de indução) 


> aa az (segue do caso n = 2) 
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iii) Passo: Supomos que a proposição vale para k variáveis, que denotamos ay,..., ak 1. Adicionamos 
uma nova variável, igual à media das outras: 


q + a2 +-+: dk 


b = 
k—1 
Pela hipótese de indução, a proposição vale para a1, a2, ..., ak, b: 
artistan ata taki Ss a +Ha +--+ ql 
“q Re 
E 2 4/ Qd k—1 KO] 
ai io Si aa ~ Ahaaa ai + a2 +: + ak1 
k=] n a E=1 
Q + a2 +: + dk- Y aa q + a2 +: + axo 
KO 2 a1a2 k—1 k] 
itas pet akı Poa ES 
ki 2 a142 k—1 
q + a2 +: + ak1 
> yaa ak 
kO > Varaz ak, 
que é a forma para k — 1. < 


x 3.10 Indução em R 


No início deste Capítulo, observamos que o princípio da indução finita é usado em demonstrações de vali- 
dade de predicados sobre N - ou seja, para demonstrar fatos da forma “para todo natural n, P(n) é verdade” 
É natural questionar se o princípio da indução pode ser adaptado para proposições P(x), onde x pertence 
a R. Nesta seção trataremos de proposições a respeito de intervalos reais (ou seja, as do tipo “para todo 
x € [a,b], P(x)”. 

O princípio da indução fraca exige que possamos estabelecer um “primeiro” x, e para cada x deve haver 
um “sucessor imediato”. Esta é exatamente a estrutura dos naturais. Podemos também usar indução em 
racionais, usando passos diferentes para o numerador e o denominador. Mas para reais, precisamos do 
princípio da indução forte (ou indução completa). 

O princípio da indução forte, no entanto, não serve para demonstrações sobre reais - ao menos não 
como o descrevemos, porque como a discussão a seguir deverá tornar claro não bastam apeans “uma base 
e um passo”. 

Suponha que queiramos demonstrar que P(x) vale para todo x em um intervalo [a, b] C R. 


i) Precisamos que a proposição valha para a- (isto é semelhante à base de indução finita); 


e O 
a b 


ii) A validade da proposição em todo real menor que x, deve implicar na validade para x - ou seja, a 
validade em num intervalo aberto em x, [a, x), implicd']na validade para x. 


“Na figura, a seta => é sinônimo de “implica em”. 
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No entanto, Isto apenas não é suficiente. Suponha que tenhamos provado que P(0) vale e que a validade 
em um intervalo implica na validade para x, ainda falta mostrar que a proposição vale para alguém à frente 
de x (de outra forma não teríamos a “validade no intervalo” a que se refere o item (ii). Assim, precisamos 
de mais um item: 


iii) Seaproposição vale para um número real x, que não está no final de um intervalo fechado, então deve 
valer para mais números depois dele - mesmo que seja um intervalo ínfimo (na figura o intervalo é 
representado por 6). 


O enunciado formal do princípio da indução em reais é dado a seguir. 


(Princípio da Indução em R). Seja p(s) uma predicado a respeito de números reais (ou seja, s € Ré o 
argumento do predicado) e a < b dois números reais. Se (i), (ii), (iii) a seguir valem: 


i) p(a) é verdadeiro; 
ii) Para todo x € [a, b), se p(x) vale, então existe algum ô tal que para todo 0 < k < 5, p(x + k) vale; 
iii) Para todo x € (a, b], se p(k) vale para k € [a,x), então p(x) é verdadeiro. 
Então p(s) é verdadeiro para todo s € [a, b]. © 


Exemplo ß.17. Demonstramos agora o Teorema do Valor Intermediário: seja f : [a,b] — R uma função 
contínua, e suponha, sem perda de generalidade, que f(a) < f(b). Então para todo f(a) < v < f(b), 
existe algum x € [a, b] tal que f(x) = v. 

Suponha que f(x) Æ v para todo x € la, b]. 

Provaremos por indução em reais, que f(x) < v, para todo x no intervalo. Ou seja, nossa proposição 
P(x) é “f(x) < v”. 


i) f(a) <v, porque é como definimos v. 

ii) Sejax € [a, b). Suponha que P(x) vale, ou seja, f(x) < v. Como 
- fé contínua, e 
— x foi escolhido num intervalo aberto à direita, la, b), 


então deve haver algum ô tal que f(x + 5) < v, ou seja, vale P(x + 5). 


iii) Sejax € (a, b]. Suponha que para todo w € [a,x], P(w) vale - ou seja, f(w) < v. Como f é contínua, 
não podemos ter f(x) > v. Mas por hipótese, temos f(x) Æ v, logo só nos resta f(x) < v, ou seja, 
vale P(x). 
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Assim, presumindo que f(x) # v para todo x € [a, b], provamos que f(x) < v, para todo x no intervalo. 
Mas v foi escolhido de forma que v < f(b), e temos uma contradição. A única suposição que fizemos foi 
que f(x) Æ v para todo x € [a, b], que agora nos vemos obrigados a negar - e a negação resulta exatamente 
no enunciado do Teorema. « 


O princípio da indução em reais (ou indução no contínuo) é descrito em diversos trabalhos; uma redação 
bastante acessível é a de Dan Hathaway [Hat11]. 

O leitor poderá ler mais sobre as diferenças fundamentais entre reais e naturais (e sobre cardinalidade 
de conjuntos infinitos) na literatura de Teoria de Conjuntos, onde também encontrará o princípio da indu- 
ção transfinita. Mencionamos os livros de Herbert Enderton [End77], de Derek Goldrei e, para uma 
introdução simples, o de Charles Pinter [Pin14]. 


Exercícios 


Ex. 331 — Prove que n! < n” para todon > 1. 


Ex. 332 — Mostre que para qualquer inteiro positivo n, 


J (3-1) =n. 


j=1 


Ex. 333 — Defina qual é o menor n para o qual as afirmações valem, e depois prove-as. 
a) n divide n? — n 
b) 13 divide 247 +2 + 31+2 
c) 37+] divide 23" + 1 


Ex. 334 — Prove que 


é sempre positivo. 
Ex. 335 — Prove que um número que tem exatamente 3™ dígitos, todos idênticos, é divisível por 3. 
Ex. 336 — Mostre que 1 +3 +5 +... + (2n — 1) = n?, para todo inteiro n > 0. 


Ex. 337 — Prove que para todo natural n > 1, 


A -> yn 


j=] 


SA 


Ex. 338 — Prove que 


NL 

> a 
i2+i n+l’ 

n=1 
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Ex. 339 — Prove que 


Vas rsir meia 


Ex. 340 — Seja 


f(O) = 


2 
f(n) =2yfm — 1) 


Prove que para qualquer n € N, f(n) < 4. 


VY- 


é irracional se a quantidade de raízes aninhadas for finita e maior ou igual a dois. 


Ex. 341 — Prove que 


Ex. 342 — Prove que há infinitos números cuja decomposição tem somente quadrados ou primos elevados 
a potências maiores (não tem primos isolados). (Por exemplo, 48200 = 2352), 


Ex. 343 — Para quaisquer m, n inteiros com m Æ 0e m >n, seja 


ojm sen=0 
Ilk] * ua r) caso contrário (r é resto de m + n) 


Prove que g(m, n) é o maior natural que divide tanto m como n. 


Ex. 344 — No Exercício (B.15/mostramos um algoritmo que calcula a paridade de um número binomial (7), 
e dissemos que o algoritmo usa 4| log, n | divisões. Prove que esta é de fato a quantidade de divisões feitas. 


Ex. 345 — Prove que para n > 2, a expansão de (1 + x + x?)™ tem pelo menos um coeficiente par. 


Ex. 346 — Prove que para n > 3, a soma dos ângulos interiores de um polígono convexo com n vértices é 
r(n — 2). 


Ex. 347 — Prove que se dividirmos o plano usando retas como no Exemplo poderemos pintar as 
regiões formadas com apenas duas cores, sem que regiões adjacentes fiquem com a mesma cor. 


Ex. 348 — Prove a fórmula de Euler: Se um poliedro tem V vértices, F faces e E arestas, então V+F-E = 2. 
Ex. 349 — Um tridominó é uma peça que ocupa tres casas contíguas mas não na mesma linha ou coluna, em 


um tabuleiro. A seguir temos exemplos de um tridominó (rotacionado quatro vezes apenas para clarificar 
como ele poderá ser usado no tabuleiro). 
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a) Prove que um tabuleiro quadrado de lado com 2” quadrados com um dos cantos removidos pode ser 
preenchido completamente por tridominós. 


b) Após cobrir um tabuleiro de tamanho 2”, quantos tridominós estarão rotacionados de cada forma 


(veja as quatro rotações na figura). Por exemplo, com n = 4, temos um CO, um e tres 


Obviamente, se rotacionarmos o tabuleiro a solução muda, mas continua sendo da forma A + B+3C 
- é esta a resposta pedida. 


Ex. 350 — Prove que para todon > 2, 


Vaya mova da 


Ex. 351 — Mostre, por indução, que a inversa da matriz diagonal A com valores a11, 022,...)Ann é a 
matriz diagonal om valores 1/0117, 1/022,...,1/ann. 


11) -7a (1 1 
11 11 


Ex. 352 — Prove que 


para todo natural n > 1. 


Ex. 353 — Seja 


Prove que paran > 1, 


Ex. 354 — Determine a forma fechada para A”, onde A é uma matriz com uns na diagonal principal; um 
elemento igual a um acima da diagonal principal; e todos os outros elementos iguais a zero. 


Ex. 355 — Determine a forma fechada para 


00 ss 


(A matriz tem zeros abaixo da diagonal principal e uns na diagonal e acima dela). 
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Ex. 356 — Prove a corretude do algoritmo de Strassen. Sejam 


A= (Aut. Au) B= (Bia Bia) , 
A21 | A22 B21 : B22 


duas matrizes particionadas em quatro blocos cada uma (as partições de A e B são tais que permitem 
multiplicar AB por blocos). 
Seja 


onde os quatro blocos de C são 


C12 = M4 + Ms 


onde 


( )(B21 + B22) 
M2 = (A11 + A22)(B11 + B22) 
( )(B11 + B22) 
Ma = (A11 +A12)B22 
Ms = Ar (B12 — B22) 
Me = A22(B21 — B11) 
M7 = (A21 + A22)B11 


Prove que C = AB, ou seja, ao calcular as matrizes M; e montar C da maneira descrita, teremos multipli- 
cado A por B. 


Ex. 357 — Seja 


f(1)=1 

f(2)=5 

f(n+1)=2f(n—1) 

Conjecture uma fórmula para f(n), presumindo que n sempre é natural, e prove por indução que sua fór- 
mula está correta. 


Ex. 358 — Seja a1, a2,... uma sequência de números reais tal que a;,; < ai + aj para quaisquer i e j. 
Prove que 
2 as An 


a 
< osmy E 
ansatz ts H ta 
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Ex. 359 — Seja Fn o n-ésimo número de Fibonacci: 
Fo=0 
F=] 
Fn = Fo Ea Faz 


Prove que Fn < 2” para todon > 0. 


Ex. 360 — Demonstre (a) e (b) abaixo, usando indução. 
a) Todo número natural pode ser decomposto em fatores primos. 


b) seja Z[x] a estrutura algébrica composta por polinômios com coeficientes inteiros e as operações de 
soma e multiplicação usuais sobre elef] Assim como para números naturais, a divisão está definida 
em Zx]. Um polinômio em Z[x] com é irredutível se não pode ser escrito como produto de dois outros. 
Prove que todo polinômio p em Z[x] pode ser decomposto em polinômios em Z [x], irredutíveis e de 
grau menor ou igual que o de p. 


Ex. 361 — Prove que |sen”(x)| < 1 — e, come > 0, para todo n € N. (Aqui sen” (x) é a repetição de n 
vezes a função seno, e não potencia). Determine e, e prove que sen” (x) pode ser exatamente igual tanto a 
1 — e quanto a —1 + e. 


Ex. 362 — Prove, por indução, a identidade de De Moivre: para todos os x € R,n € Z, 


(cosx +isenx)™ = cos(nx) +isen(nx), 
onde i = y—1. 
Ex. 363 — Prove que a função T é uma generalização do fatorial. Ou seja, dada a função 
[0.0] 
T(x) = | Le tdi 
0 


Prove que para todo n natural T(n + 1) = n!, ou seja, 


00 
| tTetdt=n! 
0 


Ex. 364 — Prove que para todo n > 1 natural, 


Ex. 365 — Prove que 


. TT 
e em seguida calcule fġ sen? xdx. 


5Esta estrutura é um anel. 
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Ex. 366 — Prove que a n-ésima derivada de x” én!, 
Ex. 367 — Demontre a generalização da regra do produto para derivadas: 


(fif2f3 fn)” = fif2f3 -fn 
+ fifbfa -fn 
RE fifof fn 


+ fifofa fa 
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Ex. 368 — Seja f : [0,1] > R cotínua e infinitas vezes diferenciável em (0, 1). Denote por f!") a n-ésima 


derivada de f, e seja f° = f. Prove que para todo m € N, 


1 m j= j— 1 p n+mem 
l | x"flx)dx = 5. ao) + ( nr E ae 
j=1 


n! Jo (n=+j)! o (nem)! 


Ex. 369 — Prove que para todon > 2, 


1 (72 e Get (Mm =2)(2n —4)(2n — 6) --- 
IR de = an An na 


Ex. 370 — Seja f : [a, b] — R contínua, assumindo valores reais em a e b (ou seja, f(a) e f(b) são reais). 


Prove que f é limitada por cima e por baixo nesse intervalo. 


Ex. 371 — Prove o teorema do valor médio usando indução em reais: Seja f : [a,b] — R contínua, e 


diferenciável em (a, b). Então existe c € (a, b) tal que 


ou seja, existe algum ponto entre a e b onde a tangente é paralela à reta passando por a e b. 
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Apêndice y 


Orientação de Bases 


Neste Apêndice damos uma definição geometrica mais rigorosa de orientação de base ordenada em R”. 


Começamos observando vetores em R: não podemos transformar continuamente o vetor (—2) (que é 
uma base para R) no vetor (1) sem que um dos vetores intermediários seja o vetor zero: 


=A 0 —1 0 
0 0 1 


Passamos agora para R?, usando idéia análoga à que usamos para as bases de R. Não podemos transformar 
abase A = ((1,2)",(3,1)! } na base B = { (3,2)", (1,3)! } sem que, no decorrer da transformação, 
tenhamos dois vetores colineares: temos que transformar (1,2)! em (3,2)! e (3,1)! em (1,3)". A fi- 
gura a seguir ilustra a transformação. Os vetores em negrito ficam fixos, e os vetores em traçado leve são 
transformados. 


(1,2) (1,3) 


Como os vetores em negrito, (3,2)",(1,3)! formam a base B e não seriam modificados, apresentamos a 
figura sem eles, mostrando que a transformação dos vetores de A: 


497 


498 APÊNDICE y. ORIENTAÇÃO DE BASES 


0 


Note que se duas bases ordenadas À e B tem a mesma orientação, e trocamos dois vetores de posição em 
A (ou em B), elas passam a ter orientação oposta, porque já não é mais possível transformar continuamente 
A em B sem passar por uma tupla que não é base. Isso é válido também para Rº. 

Formalizaremos este conceito da seguinte maneira. Uma base para R” tem n vetores. Diremos que 
duas bases tem a mesma orientação quando houver n funções, f1,..., fn, definidas em [0, 1], tais que 
(fi (0), f2(0),...,fn(0)) = A e (f4 (1), fa(1),...,fn(1)) = B - ou seja, o valor de fi em zero é o i-ésimo 
vetor de A, e o valor de fi em um é o i-ésimo vetor de B. Isso significa que podemos variar i de zero a um, 
transformando os vetores de A nos vetores de B. As restrições que impomos às funções são: 


* Cada uma das f; deve ser contínua. 


* Para todo t € [0,1], (fi (t), f2(t),..., fn (t)) deve ser base ordenada (ou seja os vetores não podem 
ser LD). 


Definição y.1 (Bases com orientação concordante em R™). Sejam A e B duas bases para R”, Dizemos que 
A e B tem a mesma orientação se A pode ser transformada em B continuamente e sem tornar-se degenerada, 


ou seja, existem n funções f1, f2,..., fn, todas definidas como fi : [0,1] — R”, todas contínuas, sendo 
(fi (0), fa (0), -> fn (0)) =À, 
(f1(1),f2(1), <fn (1)) =B, 


e tais que para todo t € [0, 1] a tupla 
(fi (t), f2(t), veeg fn(t)) 
é uma base ordenada para R”. + 


Usualmente, define-se que a orientação de uma base B para R” é positiva (ou ainda, que O(B) = +1) se 
ela concorda com a orientação da base canônica para R”, De outra forma, é negativa (ou que O(B) = —1). 

Em R, mudar o sinal da base muda sua orientação, porque não podemos transformar um vetor (+x) 
em outro (—x) continuamente sem passar pelo vetor zero. 

Em R”, comn > 2, trocar a posição de dois vetores de uma base tem o efeito de mudar sua orientação, 
conforme o enunciado do teoremaly.2] 


Teorema y.2. Seja A uma base para R”, com n > 2, e seja A! a base obtida de A trocando as posições de dois de 
seus vetores. Então A e A’ não tem orientação concordante. 
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Exercícios 
Ex. 372 — Demonstre o Teoremafy.2] 
Ex. 373 — Escolha um espaço de funções com dimensão finita (dois, por exemplo) e exiba duas bases com 


orientação concordante. Troque a posição de dois dos vetores da base e mostre que de fato as bases passam 
a ter orientações opostas. Tente não usar a representação das bases como matrizes. 
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Apêndice ô 


Equações Diferenciais 


Em alguns dos exemplos neste livro usamos equações diferenciais. Este Apêndice traz a definição de equa- 

ção diferencial e conceitos básicos relacionados a elas. Não é uma introdução completa ao assunto - abor- 

damos aqui somente o necessário para a compreensão do texto. Há excelentes livros abordando Equações 

Diferenciais Ordinárias - bons livros com exemplos de aplicação prática incluem o de Tennenbaum e Pol- 

lard e o de George Simmons [simo6]; dentre os livros mais compactos e sem excursões por aplicações 

e métodos numéricos temos o de Herbert Bear fo e o de Earl Coddington [Cod61]; em Português há 
FNI4 


os livros de Djairo Figueiredo e Aloisio Neves [FN14] e de Vinícius Cifú Lopes [Lop15]. Sobre Equações 
Diferenciais Parciais, mencionamos os livros de Walter Strauss [stros], de Fritz John [Joh82] e de David Col- 
ton e, para um ponto de vista bastante pragmático, o de Stanley Farlow [Far82]. Em Português, o 
livro de Djairo Figueiredo dá uma introdução às EDPs como aplicação de Séries de Fouriel[] 

Começamos com um exemplo onde modelamos um fenômeno de crescimento com uma equação dife- 
rencial. Suponha que estejamos estudando uma cultura de bactérias. Se a quantidade de bactérias triplica 
em uma hora e a quantidade inicial de bactérias era xo, quantas bactérias teremos na cultura após cinco 
horas? 

A equação diferencial que descreve o crescimento das bactérias é 


dx 
Ro kx. 
Esta equação nos diz exatamente que “a variação na quantidade x de bactérias ao longo do tempo é propor- 
cional a x, com constante de proporcionalidade k”. A equação nos informa uma relação entre a quantidade 
de bactérias e sua taxa de crescimento no tempo, mas não nos dá uma expressão da quantidade x de bac- 
térias no tempo t. Nossa intenção é obter uma expressão de x(t) que não envolva a derivada dx/dt. 
Observando que temos dt em ambos os lados da equação, integramos os dois lados com relação a t, 


|; dx | 
—— dt = | kdt. 
x dt 


| Liu = [rat 
x 


iDamos uma breve introdução à série de Fourier no Capítulo[i4]do presente livro; o livro citado, de Djairo Figueiredo, é mais 
extenso e detalhado. 
2f f(g(t))g'’(t)dt = ff(u)du, comu = g(t). Neste caso, g(t) = x(t), e f(g(t)) = 1/x(t). Observe que a não é uma 


Por substituiçãa?] temos 
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Disso já podemos concluir que log(x) = kt + c, e portanto temos x(t) = ekt+c, No entanto, não co- 


nhecemos k nem c - somente sabemos que qualquer função da forma x(t) = ekt+c é uma solução para 
a equação diferencial. No entanto, não queremos uma solução envolvendo qualquer valor para k. Quere- 
mos determiná-lo. Sabemos que a constante c será cancelada quando calcularmos a integral definida. A 
constante k nos será conhecida também quando usarmos a equação com as condições dadas. 

Agora observamos: 


i) A quantidade de bactérias triplica a cada hora; 
ii) A quantidade inicial de bactérias era xo; 


iii) Queremos a quantidade de bactérias após 5 horas. 


3q 1 1 
Í ta] kdt. 
P 0 


De (i), temos 


Integramos o lado esquerdo com x começando em um valor arbitrário q e terminando em 3q, porque em 
uma hora a quantidade inicial triplicará. Mais adiante veremos que a variável q será cancelada em nossas 
contas. 
Integramos o lado direito em t, que varia de zero a um (porque uma hora é o período em que observamos 

a quantidade triplicar). Temos então 

3q 1 1 

| —dx = | kdt 
1 X 0 


3 1 
logx|çº mkt. 
3q 1 
E =kt| o 
log3 =k 


Já conhecemos a constante k. Agora, de (ii) e (iii), temos 


Q] 5 

| cx) kdt 

Xo X (0) 
logx|$ Eltlo 

log(Q) — log(xo) = 5log 3 


jog Š = log(3º) 
Q = 3ºxo. 


fração, por isso não podemos “cancelar” dt. Poderíamos usar a definição de diferencial: dy = y'dx, e, entendendo que dt na equação 
é um diferencial, cancelá-lo. No entanto, a noção de diferencial ainda pressupõe a existência da derivada y’ definida como limite. É 
possível, na verdade, construir o Cálculo sem definir a derivada como limite. Isso se faz usando Análise Não-Padrão, desenvolvida 
originalmente por Abraham Robinson [Robo], mas que fica fora do escopo deste texto. A Análise é uma área da Matemática onde 
são estudadas as teorias que fundamentam o Cálculo Diferencial e Integral, convergência de séries, e outros tópicos, ali estudados em 
profundidade e com mais rigor do que em um curso de Cálculo. A Análise não-padrão reconstrói os fundamentos do Cálculo usando 
“infinitesimais”. Uma abordagem de Cálculo baseada em Análise Não-Padrão é usada no livro de Howard Keisler [kei12]; jáo livro de 
Alain Robert contém um curso moderno de Análise Não-Padrão. 
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Assim, após 5 horas, teremos 3º vezes o valor inicial xo. 

O que fizemos neste exemplo foi determinar uma equação diferencial que descreve um fenômeno, e 
em seguida “resolvê-la” - ou seja, encontrar uma descrição da função incógnita que não dependa das suas 
derivadas. 


d.1 Equação Diferencial Ordinária 


Definição 6.1 (Equação diferencial). Uma equação diferencial ordinária é uma equação envolvendo uma fun- 
ção de uma variável e uma ou mais de suas derivadas. A ordem da equação é a maior ordem de derivada 
da função incógnita presente na equação. O grau da equação é o expoente da derivada de maior ordem. 
Dizemos que uma equação diferencial é linear se é de grau um. + 


Exemplo 5.2. A seguir temos exemplos de várias equações diferenciais ordinárias. 


Lita) Pétto)-3=0 
dx 

y”—-y=0 

(x)? +x? — x =0 


A primeira equação é linear e de primeira ordem. A segunda é linear de segunda ordem. A terceira é de 
primeira ordem e segundo grau. « 


Exemplo 6.3. A equação logística é uma equação diferencial ordinária normalmente usada na modelagem 
de crescimento de populações. A população no instante t é P(t); a taxa de crescimento é r (também é 
chamada de parâmetro Malthusiano), e K é a densidade populacional máxima: 


dP P 
Tehi) 


Esta é uma equação diferencial ordinária linear e de primeira ordem. < 


Exemplo 5.4. A lei segunda lei de Newton, F = ma, é na verdade uma equação diferencial ordinária. 
Newton a formulou tendo em mente a massa da Lua e a força gravitacional entre Terra e Lua: 


Esta equação é linear e de segunda ordem. < 


Definição 6.5 (Solução de equação diferencial). Uma solução específica para uma equação diferencial envol- 
vendo derivadas de uma função desconhecida f é uma função que pode ser usada no lugar de f satisfazendo 
a equação. A solução geral para uma EDO é uma descrição de todas as soluções específicas para aquela equa- 
ção. + 


Exemplo 5.6. Para quaisquer a e b, a função 


3 
y=% +ax+b 
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é solução da equação diferencial 


y Mo x= 0, 
porque 
x3 FE 
uy! —-x= (= +ex+b) -x 
x? ( 
E E t a) Y 
=x—x 
Assim, 
x3 
Y= gay a,beR 
é a solução geral, enquanto 
A: 
=i 
= E +xH] 
Im 
ao 
ve —3x + V2 
A 
a: 
são solções específicas para a equação. « 


No exemplo [5.6] o conjunto de soluções para a equação pode ser definido por duas constantes, logo 
temos uma quantidade infinita mas enumerável de soluções. 


d.2 Separação de variáveis 


Nesta seção apresentamos um método básico para solução de algumas equações diferenciais ordinárias. 
Este método servirá apenas para poucas situações simples, e é incluído aqui apenas como ilustração. Mé- 
todos apropriados a equações diferenciais de outros tipos são encontrados nos livros já citados no início 
deste Capítulo. 

Quando é possível reorganizar as variáveis de forma que cada uma fique de um lado da equação, pode- 
mos usar o método de separação de variáveis. 


Teorema 65.7. Sejam f e g funções contínuas, F’ = f, G’ = g, e y é solução de 
J g gey 


dy 
gY) Tx = f(x), (8.1) 


6.3. PROBLEMAS DE VALOR INICIAL E DE CONTORNO 


então existe uma constante c tal que 


G 


(u(x)) = F(x) +c. 


Além disso, qualquer função y que satisfaça[ô.2/para algum c é solução de[6.1] 


Demonstração. Temos 


dy 
O ft 
gug — f(x) 
d 
[om Rax= | figa 
[otay = [toda 
G(y) = F(x) +c 
Tax = dy. 
Exemplo 5.8. A equação 
y’ o x2 = x2y 
pode ser reescrita como 
y’ =x(y+1) 
1 
AU a 
y +1 dx 
Temos portanto 
—— dy = | xd 
E yT% [x x 
x3 
log(y +1) = z te 


y +1 = exp(x?/3 + c) 


y = exp(x?/3+ c) = 1, 


que é solução para a equação diferencial da qual partimos. 


Exemplo 5.9. A equação 


pode ser reescrita como 


Integramos ambos os lados, 


[vay S | esençejax 


en(x) — x cos(x) +c 


E/2(sen(x) — x cos(x) + c). 
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(6.2) 


(integre ambos os lados em x) 


(substituição/regra da cadeia) 
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5.3 Problemas de valor inicial e de contorno 


Muitas vezes não temos interesse em ober todas as soluções para uma equação diferencial, e nem mesmo 
uma solução específica qualquer, mas sim uma solução que satisfaça certas condições. Em um problema de valor 
inicial temos, além de uma equação diferencial descrevendo uma função f(x), temos o valor da função em 
um ponto, por exemplo f(z) = v, e procuramos uma solução F que satisfaça F(z) = v. Se tivermos valores 
de f em vários pontos, temos um problema de valores de contorno (ou problema com condições de contorno). 
O que fizemos no início do Capítulo foi resolver um problema de valores de contorno: sabíamos que o 
crescimento de bactérias em uma cultura era descrito por 


DN, 
e tínhamos também um valor xo e o valor xı = 3xo. 
Exemplo 5.10. O problema 
y” +2y'—3x=0, 
y(n) =2, 
y'm) =-=] 


é um problema de valor inicial, porque além da equação diferencial, temos a descrição dos valores de y e 
y’ em um ponto. « 


Exemplo 5.11. O problema 


y +y2x=o0, 
y (0) To) 
y(1) =—5 
é um problema de valores de contorno, porque além da equação diferencial, temos a descrição dos valores 
dey ey em dois pontos. « 


ô.4 Equação Diferencial Parcial 


Definição 6.12 (Equação diferencial parcial). Uma equação diferencial parcial é uma equação envolvendo 
uma função de várias variáveis e uma ou mais de suas derivadas parciais. 4 


Exemplo 5.13. A seguir temos exemplos de equações diferenciais parciais. Ao descrever as derivadas, 
. A . 3 
pode-se usar u,xx como sinônimo de a. 


x y 
tn — E ss = 0 
92f(x,y) +xy 9f(x,y) df(x,y) 


Ox? Ox ðy 9 s 
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Observamos que o conjunto de soluções para uma EDP é bastante diferente daquele para uma EDO. Por 
exemplo, considere a EDP a seguir: 

du 

o 


0. 


A solução geral desta equação é 
ulx,y) = fly), 


onde f : R — R pode ser qualquer função real de uma variável - e daí notamos que embora as soluções 
para uma EDP sejam um conjunto infinito, com as de uma EDO, este conjunto não é enumerável (porque o 
conjunto de funções reais não é enumerável). 


5.5 Aplicações 


A quantidade de aplicações possíveis de equações diferenciais é imensa, e seria ingênuo resumí-las em uma 
pequena seção de um livro. Podemos, no entanto, selecionar alguns poucos exemplos. 


6.5.1 Química nuclear: decaimento radioativo [ EDO de primeira ordem 


] 


Sabemos, a partir de estudos experimentais, que a velocidade de desintegração de qualquer material radio- 
ativo é proporcional à quantidade daquele material. Ou seja, quanto mais material radioativo, mais rápido 
ele se desintegra. 

A velocidade de desintegração é a derivada da quantidade em relação ao tempo, dAM/dt. Como ela é 
proporcional à quantidade, chegamos à equação diferencial do decaimento radioativo: 


com k < 0. Esta é uma equação diferencial linear e de primeira ordem. 


6.5.2 Mecânica: oscilador harmônico [ EDO de segunda ordem | 


Suponha que uma mola de compimento c está fixada abaixo de uma superfície, sem nenhuma força atuando 


sobre ela. 
3 í 


Prendemos na outra extremidade da mola um objeto com masa m. Como a mola é elástica, o objeto (e 
consequentemente a extremidade da mola) será deslocado para baixo, por uma distância l. Nesta posição 
o sistema estará em equilíbrio, e não haverá movimento. 
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Haverá duas forças atuando sobre o objeto (ou, equivalentemente, sobre a extremidade de baixo da 
mola): 


* a força gravitacional, na direção para baixo, com intensidade mg; 


* a força da mola, que tentará retornar o sistema ao ponto de equilíbrio. A Lei de Hooke determina que 
esta força é proporcional à distância do ponto atual ao ponto de equilíbrio, logo sua intensidade é kl. 
Para cada mola existe um valor de k, chamado de constante elástica da mola. 


Assim, temos 
mg = kl. 


Agora puxamos o objeto mais para baixo, forçando-o a descrever uma distância adicional x. 


Agora as duas forças atuando são a força gravitacional, que continua a mesma, e a força da mola para tentar 
retornar ao ponto de equilíbrio, que passa a ser 


k(l +x). 


Usamos agora a segunda lei de Newton, F = mã: a força resultante em um sistema (F) será igual à massa 
do sistema multiplicada por sua aceleração (ma). Como já conhecemos a orientação da força, deixamos 
de lado a notação de vetor e usamos somente a magnitude de a e g: 


ma =mg-—k(L+x) 
d?x 
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d?x 
Temos finalmente 
d?x E: k b 
d? m? 


que é a equação diferencial que descreve o movimento de uma mola. 
Esta é uma equação diferencial linear e de ordem dois. 
A solução para esta equação é dada por 


k 

Xx = Q COS —t+ô 
m 
k 

x = «sen —t+6). 
m 


6.5.3 Termodinâmica: propagação de calor [ EDP | 


ou 


Grosso modo, o calor pode ser tranferido de três maneiras: em fluidos, a transferência se dá principalmente 
por convecção (o próprio fluido se move, levando calor); outra forma de transferencia é condução, sem que 
haja movimento da substancia; finalmente, o calor pode ser transferido por radiação. 
Nesta seção analisaremos a condução de calor, chegando a uma equação diferencial parcial. 
Trataremos aqui somente do caso emuma dimensão: temos uma barra como a ilustrada na figura a 
seguir, e aplicamos calor em uma das suas extremidades. 


ISO e cag 


x: “x + dx 


Sabemos que a quantidade de energia necessária para aumentar em du a temperatura de um corpo com 
massa m é proporcional a m, mas a constante de proporcionalidade depende do material de que o corpo é 
constituído. Podemos dizer, portanto que essa quantidade é sm du, onde m é a massa do corpo; s é uma 
constante que depende do corpo (chamamos de calor específico; e du é o valor do aumento na temperatura 
(note que já usamos notação de diferencial). 

A energia flui por uma superfície a uma taxa proporcional à área (que denotamos por A) e ao gradiente 
da temperatura, ou seja, KA(du/0x). À constante k damos o nome de condutividade térmica. 

O gradiente da temperatura no extremo da direita é 


du 


Fe + dx, t). 


Assim, a energia passa pelo extremo da direita a uma taxa de 


ð 
ka SE (x + dx,t). 
Ox 
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Em um intervalo de tempo infinitesimal, uma certa quantidade de calor entra na barra pelo lado direito, e 
outra quantidade sai pelo lado esquerdo. A quantidade total de calor que entra na barra é, portanto, 


du ou 
kA—(x+ dx,t)—-kA— (x,t). 

Ox Ox 
Ne eee” — eee? 

entra à direita sai à esquerda 


Suponha que a densidade da barra é D. Então a massa é DA dx, portanto a quantidade de energia necessária 
para aquecer a barra em su (x+ dx, t) é 


ð 
s m du = s DAdx = (x + dx, t) 


Esta deve ser a mesma quantidade de energia que entrou na barra no intervalo de tempo dt: 


d ð d 
sDAdx (x, t)dt = kA |kA | (x + dx, t) -ka & (x,t) | dt 
Ot Ox ox 
ou seja, 
ə 2? 2? 
sDASE(x,t) =kA aii + dx,t)— KAS% o| 


ot ox2 


Quando dx, dt — 0, temos 


ou o? 

SDA sp (ot) =kA z (x,t) 
du k \ du 
zel t) = (5) 3 7 (xt) 


Denotamos por « = k/sD, e chamamos « de difusividade térmica. Chegamos assun à equação do calor em 
uma dimensão: 

ou du 

— > X—— 

ot ax? 


Apresentamos a equação do calor para três dimensões”) sem incluir sua derivação: 


du E a 
do dy? dz! 


Exercícios 


Ex. 374 — Algumas das funções à esquerda são soluções para as equações à direita. Identifique-as. 


*Uma forma alternativa de escrever a equação do calor é, 


ð 
Ma aVŽu 
ot 


2 
se denotarmos o Laplaciano por V2. O Laplaciano é dado pela divergencia do gradiente, V2f = V Vf, ou seja, V2f= 5 1, 2z. 
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y'—cos(x) =0 (i) 
(a) y(x) = ae* +x? +2x +2 y” +e*=0 (ii) 
(b) y(x) = asen(x) + b cos(x) e3 —y”+x=0 (ii) 
(c y(x) =x? + e* P AOE S iv) 
(d) y(x) = cos(x?) ' ns J) 
(e) y(x) = —log(x) + ax + b a É 
(f) ulx)=+tvx+a ; y 
(g) y(x) = ax? — b TA vii) 

y’—y +x? =0 (viii) 


Ex. 375 — Determine soluções para as equações diferenciais dadas. 


X 
Day = = 0 
QLI 


ii) y” +ycos(x)=0 


iii) ai dy — x“ cos(y) = O 
iv) y—2y'=0 

H x 
WC E O 

x cos(y) 


Ex. 376 — O isótopo Pluônio-241 (2!Pu) tem meia-vida de 14 anos (ou seja, a massa radioativa desse isó- 
topo cai pela metade em 14 anos, unicamente por emissão radioativa). Determine a constante de pro- 
porcionalidade para a equação de decaimento deste isótopo, ou seja, determine o valor de a na equação 
dM/dt = aM. 


Ex. 377 — Considere equações diferenciais da forma 
P(x, y)dx + Q(x, y)dy = 0, 
onde P e Q são homogêneos da mesma ordem n, e tanto dx como dy são diferenciais. Prove que substituir 


y > ux 
dy — udx + xdu 


resulta em uma equação com variáveis separáveis. 


“mais especificamente, por decaimento B~: seu núcleo muda, tornando-se um núcleo de Amerício (o número atômico aumenta), 
ao mesmo tempo em que emite um elétron e um elétron antineutrino - o tratamento em detalhes do assunto é feito no livro de Walter 
Loveland, David Morrisey e Glenn Seaborg [LMo6]; uma explicação extremamente simplificada de decaimento 3 pode também ser 
obtida no livro de Harry Lipkin pi. 


512 APÊNDICE ô. EQUAÇÕES DIFERENCIAIS 


Apêndice € 


Alfabeto Grego 


Uma vez que letras gregas são abundantes na Matemática, incluímos neste apêndice o alfabeto grego, com 
a pronúnica de cada letra. 


maiúscula minúscula pronúncia 
alfa 
beta 
gama 
delta 
épsilon 
zeta 

eta 

teta 
iota 
capa 
lambda 
mi 

ni 

csi 
ômicron 
pi 

rô 

sigma 
tau 
úpsilon 
fi 
qui 

psi 
ômega 


D M 
vINMAS DR 


A 


A 


A E 


E&x Seanad Dome F>- 


DeExeS4AMTOONZEDANOINMDSWR 
e 
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Apêndice č 


Dicas e Respostas 


Resp. (Ex. 3) — Seja (G, -) um grupo, e sejam 1 e 1º dois neutros. Então 


Ix=x =x], 


1'x =x = xI 


Agora, seja x = (1'). Então 1(1) = (1º) = (1')1. Mas pela segunda igualdade, 1'(1) = (1) = (1)1”. 
Temos então 1 = 1”, 


Resp. (Ex. 5) — Não. A matriz A = (9 | ) não é zero, porque não vale B + A = B para todo B; por outro 
lado, A não tem inverso multiplicativo, porque contém um elemento zero. 


Resp. (Ex. 7) — Não. (i) tanto V como A são associativas; (ii) ^ é distributiva sobre V: a A^ (b V c) = 
(a Ab) V (a Ac); (ii) o neutro para V é 0, e para ^ é 1; (iv) no entanto, não há inverso para V e 1: 
Aa: 1Va=0. 

Poderíamos tentar trocar V com A, mas então perderíamos a propriedade (ii). 


Resp. (Ex. 10)— x = 0,y = 1,z = 0. 


Resp. (Ex. 12) — (vi) Não, porque não é verdade que Yv 3 — v. As outras propriedades, no entanto, va- 
lem. (vii) Como se trata de subconjunto do conjunto de todas as funções, não é necessário demonstrar as 
propriedades de espaço vetorial: mostre apenas que a soma e multiplicação por escalar resultam em outra 
função com período n, e observe que f(x) = O é periódica com qualquer período (inclusive 7). 


Resp. (Ex. 15) — Há diversos exemplos. Um deles éy'+y ln(x) = 0, com soluções da forma y = ce” 7*0), 
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Resp. (Ex. 16) — (i) A função zero está bno subespaço: se a = b = 0, então a + b = 0. (ii) A soma de duas 
soluções desta forma é outra também desta forma: se (a + b) = (x + B) = 0, e (a + &)e* — (b + B)e* 
é solução, temos (a + &) + (b + B) = (a + b) + (x+ B) = 0. (iii) A multiplicação por escalar também é 
fechada: Se (a + b) = 0, e c(ae* — be™*) é solução, então ca + cb = c(a +b) = c0 = 0. 


Resp. (Ex. 25) — Muito claramente, para cada linha i, 


k(ai1X1 + Qi2X1 +: + an) 
=k(0) = 0. 


Resp. (Ex. 26) — v + w é solução para (ii): 


Resp. (Ex. 27) — O vetor zero não é solução para sistemas não homogêneos. 


Resp. (Ex. 29) — Como o conjunto só contém matrizes diagonais, a soma e multiplicação de matrizes po- 
dem ser usadas. Para matrizes quaisquer, isso já não funcionaria. 


Resp. (Ex. 32) — Pode-se mostrar mais do que pede o exercício: que todo subespaço de R? diferente do 
espaço trivial e diferente do R? é uma reta. Os subespaços de R? são: 


i) o espaço trivial (0): 
ii) espaços maiores que o trivial, mas não iguals a RŽ; 
iii) o próprio R2. 
Somente o caso (ii) é relevante. Suponha então que um vetor (x,y) pertença a um subespaço X c RZ, 
Então todos os múltiplis desse vetor também pertencem a X, e portanto temos uma reta em X. Agora 
mostramos que não pode haver ninguém mais além dessa reta. Suponha que haja um em X um vetor (a, b) 


que não pertença à reta dos múltiplos de (x,y). Somando múltiplos de (x,y) e (a, b) podemos escrever 
qualquer vetor de R, e portanto, se houvesse tal vetor (a, b) em X, teríamos X = RŽ. 


Resp. (Ex. 33) — (i) sim, (ii) não. 


Resp. (Ex. 37) — Não, porque há funções que não são pares nem ímpares, portanto F(R) não é soma dos 
dois conjuntos dados. 
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Resp. (Ex. 38) — (i) Não, porque a multiplicação de uma matriz por um escalar negativo muda o sinal de 
todos os elementos. (ii) Não, porque o segundo conjunto não contém a matriz zero, e também porque a 
soma de matrizes não preserva singularidade. 


Resp. (Ex. 44) — Não: a base deve ser L.I., e portanto não pode conter o vetor zero; a multiplicação de vetor 
da base por escalar não pode resultar em outro vetor da base; e a soma de dois vetores da base não pode 
resultar em outro vetor também na base. A base não pode ser subespaço! 


Resp. (Ex. 45) — Sim, de outra forma teríamos um vetor (...,k,...) na base, com k £ 0, e todo vetor da 
base também pertence ao espaço vetorial. 


Resp. (Ex. 48) — (i) Infinito. (ii) Dimensão um. O espaço das sequências constantes é gerado por somente 
uma sequência constante diferente de zero. 


Resp. (Ex. 52) — Suponha que em um espaço V não seja possível encontrar k vetores LI. Que se pode con- 
cluir a respeito de sua dimensão? 


Resp. (Ex. 55) — Escrevemos a fórmula genérica, 
F=m 6º 
e, sabendo que as dimensões são as mesmas dos dois lados, calculamos 
[F] =[mºv?rs] 
MLT? = (M)ºS (LT!) L€ 


e chegamos a 


a =1 
b+c=1 
—b =—2 
oquenosdáa=1,b=2,c=-—1,ea fórmula é 
p ep 
T 


Resp. (Ex. 56) — O isomorfismo é dado por 


f(a + bi) = f 2) 


a 
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Resp. (Ex. 71) — Depende! Se permitirmos a rotação usando qualquer ângulo, a transformação certa- 
mente levará a pontos fora de A?, já que envolveria seno e cosseno de números algébricos - seria então 
uma transformação de A? em R?, e não um operador em AŻ. Para continuar em A? a rotação teria que ser 
restrita apenas a ângulos transcendentais. 


Resp. (Ex. 80) — Como mencionado no exemplo o kernel desta transformação é o conjunto de todas 
as funções constantes, e portanto não contém apenas a função f(x) = 0. A derivada, portanto, não é 
injetora. 


Resp. (Ex. 82) — Usamos o isomorfismo entre o espaço de dimensão n e R™. O operador é 
f [(x1,x2 .. Bra! | = (0,x1 1X23 + +3Xn—] ). 


O posto de f én — 1. Opostodef*én — k, paral <k <n. 


Resp. (Ex. 85) — AB também terá uma linha com zeros. O mesmo acontece com colunas de B: se B tem 
uma coluna com zeros, AB também terá. 


Resp. (Ex. 86) — Trivial: uma matriz diagonal é triangular superior e inferior, por isso sua inversa deve ser 
também. 


Resp. (Ex. 91) — (Dica) Observe que AAT! = T; suponha que A é triangular inferior, e observe que T é 
triangular superior, e que portanto ao multiplicar A por A”, os elementos abaixo da diagonal devem ser 
zero. 


Resp. (Ex. 94) — Primeiro observamos que operações elementares em linhas ou em colunas não mudam a 
quantidade de linhas (ou de colunas) L.I. em uma matriz. 

Seja A uma matriz. Realizamos operações elementares em linhas até obter a forma escalonada reduzida por 
linhas de A, que denotamos A”. Esta matriz A’ é triangular superior, e sua diagonal contém apenas zeros 
e uns. 

Agora realizamos operações elementares em colunas até obter a forma escalonada reduzida por colunas 
de A”, que denotaremos por A”. As operações em colunas não mudam a parte abaixo da diagonal, que 
continha zeros - mas também transforma a parte superior de forma que contenha zeros. A matriz A” é 
agora triangular inferior, também. 

A” étriangular inferior e superior - ou seja, é diagonal. Além disso, os elementos da diagonal são uns e ze- 
ros. A quantidade de linhas L.I. e a quantidade de colunas L.I. é claramente a mesma (e é igual à quantidade 
de uns na diagonal). 


Resp. (Ex. 96) — 
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1 0 0 x x x? 
D = | —2/x 1 0 04 3x 
3/x —3/2 1 00 = 


Resp. (Ex. 97) — Decomponha A = LU. Queremos portanto X = (LU)! B, ou seja, LUX = B. Usamos a 
mesma idéia da Seção[4.8.1)para obter as colunas de X individualmente. 


Resp. (Ex. 100) — Use indução em k e o Teorema[6.42] 


Resp. (Ex. 107) — Seja S o espaço de matrizes simétricas e 4 o espaço das matrizes anti-simétricas. Defina 
uma transfomração T : S — Acom T(M) = DM—MD. Mostre que o núcleo de T é o espaço das matrizes 
diagonais, e que portanto T tem posto 


n(n+1) nino) 


2 z 2 


Assim, T é sobrejetora, e para cada A € A, existe uma simétrica S tal que A = T(S) = DS — SD. 


Resp. (Ex. 109) — O método multiplica a matriz (que denotaremos por A) por diversas matrizes elemen- 
tares até chegar à identidade, portanto EkEx—1 ... E1A- = Z. Mas 


EkEk 1... EA =T 
EkķEk—1 ... E1 = AT! (multiplique à direita por A!) 
ExEx-...EjZ = AM, 


Mas a última linha acima descreve exatamente a sequência de operações que o método também aplica na 
identidade, e portanto a matriz à direita é de fato A7 !. 


Resp. (Ex. 110) — A matriz com uns na diagonal secundária, 


À ass 01 
: 10 


Resp. (Ex. 115) — Faça a multiplicação por blocos: para a primeira matriz, 
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onde v — (x,y)!. 
Para a segunda, faça o mesmo, mas permutando linhas e colunas antes. 


Resp. (Ex. 119) — É importante definir claramente o que precisa ser provado: (i) Que A = [idlg,p, ou 
seja, que ao aplicarmos A na base B, obtemos uma outra base para o mesmo espaço vetorial - para isto basta 
mostrar que a aplicação re A na base B resulta na mesma quantidade de vetores LI. (ii) Que A = [idle,p. 
Para isto basta observar que AE = B, e portanto E = A-!B. Mostre que E também é uma base, ou seja, 
que A”! aplicada em B resulta em n vetores LI. 


Resp. (Ex. 122) — 


(—9i — 3)/10 
(a) x=| (2i+?9)/20 
(i + 2)/20 
i—1)/10 
(b) x= | (4—i)/20 
1/20 
(1 —4i)/5 
(c) x= | (3 +7i)/20 
3i + 5)/20 


Resp. (Ex. 123) — Na última matriz, observe que se subtraírmos o dobro da primeira linha à terceira obte- 
mos 
DS RS 7 — 0 
22 12 3/2 15 —2 


47 0O O Ot 
10 3 3/2 34 -2 


<71 16 0 0 0 


Se subtraírmos ainda a segunda linha da quarta, teremos 


2'3 7431 0 
22 12 3/2 15 —2 
472 0 0 0 0 

—2 2.0 19 0 
—91 16 0 0 O 


Permute linhas e colunas para obter uma matriz triangular. 


Resp. (Ex. 125) — (Dica) a fórmula divide o determinante (volume de um paralelepípedo) por 2 e também 
por 3. 


Resp. (Ex. 128) — Sejam a e B duas bases. Então 
[Al« = lidlg,« [A]g lidle,p 
det[Al« = det ([idlp,« [A]g [id 
— det (ld) [A]p lidlz!) (idla, = lidig o) 
= det (lid]g,«) det t (Ale) det (lidig 14) 
= kdet ([A]g )k7 (k = detlid]g x) 
= det[A] 


Es ADS 


Br 


Resp. (Ex. 131) — det A’ = +d se k for par, ou —d se k for ímpar. 
Resp. (Ex. 133) — (i) Mostre que det(E) = det(E!). (iv) A é produto de matrizes elementares? 


Resp. (Ex. 138) — Esta função usa módulo, e |x| não é linear. Assim, a função não é multilinear nas colunas 
da matriz. 


Resp. (Ex. 139) — Compare o posto da transformação com o da matriz. 


Resp. (Ex. 140) — (a) Uma das maneiras é mostrar que BnCn = Pn. Outra é escalonar Ph. (b) Use a 
expansão de Laplace na primeira linha ou coluna, (c) Na demonstração de (b), foi usada a expansão de 
laplace numa linha com uns. Se ao invés de uns tivermos uma constante c ao longo de uma linha de uma 
matriz qualquer, a expansão de Laplace nos dará 


det(M + K) = (det M) (c +k)/c 


Resp. (Ex. 143) — Comece construíndo uma matriz com blocos 


E 
B (Tk 


e use decomposição LU em blocos. 
Resp. (Ex. 145) — Z2, porque todo elemento é seu próprio inverso aditivo, e portanto a + b = a — b. 


Resp. (Ex. 146) — As de ordem ímpar. Observe que A! = —A. Calcule o determinante em ambos os lados, 
obtendo det(A!) = det(—A). Assim, det(A!) = (—1") det(A). Quando n é ímpar, necessariamente 
det(A) = 0. 
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Resp. (Ex. 148) — a = 17/2. 


Resp. (Ex. 150) — (i), (ii): São LI em qualquer intervalo real. O Wronskiano é e*, que sempre é diferente 
de zero. (iii) Pelo teste do Wronskiano, são LI em qualquer intervalo contendo x = 1. Além disso, para que 
as funções fossem LD deveria haver uma constante k tal que k(x*) = e*. Mas isso significaria que 


e portanto k não seria constante, e sim uma função de x estritamente decrescente em x, e sempre diferente 
de zero. (Isso reforça que o teste do Wronskiano identifica que funções são LI apenas em alguns e em alguns 
intervalos, mas não necessariamente todos). 


Resp. (Ex. 153) — O determinante é 


(1A1A1)§ (A141) (040/0) 
(0 A141] (1A0A0) g (1A0/1) 
=11=0 


Resp. (Ex. 154) — Argumente usando a fórmula de Leibniz. 


Resp. (Ex. 155) — O determinante de AT! é 1/ det(A), portanto para que a matriz tenha inversa com en- 
tradas inteiras, seu determinate deve ter inverso inteiro - o que significa que deve ser +1 ou —1. 


Resp. (Ex. 156) — A matriz A dos coeficientes e as matrizes A; são 


111 011 101 110 
A=lao!) Asirio Asji n1 o) As=[11 1]; 
011 N 1] 011 011 


Os determinantes são: 
det(A) = 1, det(A1) = 1, det(A>2) = O, det(As) = 1 


O vetor b é 


Finalmente, obtemos 


det(A1) a 
= EPA e NE 
o det A $ 
aa SA GATT SOAT; 


— det(A) 
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Pode-se substituir os x; no sistema para verificar a validade da solução. 


xı 8x: 9x =18091= 
x 8x2=18€0=1 


x2 6x3 AQE I= 


Resp. (Ex. 157) — Se 
fla +bi) =A= o 2) 


então 


det A = det (a Sy) = a°? — [b(—b)] = a? + b?, 
b a 


que é o quadrado da norma (valor absoluto) do número complexo dado. 


Resp. (Ex. 158) — Somente 1, —1 e 0, de outra forma haveria uma submatriz quadrada de ordem um com 
determinante diferente de +1 e diferente de zero. 


Resp. (Ex. 159) — A parte fixa das soluções é inteira. A outra parte não. 


Resp. (Ex. 160) — Z} ,e de maneira geral, espaços sobre o corpo Z2. Se agregarmos os vetores para formar 
uma matriz e calcularmos seu determinante, ele será necessariamente +1 ou 0, que são os únicos escalares 
neste espaço (lembre-se que Z2 = (0, 1)). Assim, quando o determinante é zero, há vetores linearmente 
dependentes, e não temos uma base. Quando temos de fato uma base, o determinante será sempre um. 


Resp. (Ex. 161) — Trivialmente, não! Basta considerar T(v = 0). De maneira mais geral, multiplicação 
por escalar é uma transformação linear, e se multiplicarmos uma matriz inteira por um escalar c, teremos 
multiplicado seu determinante (e consequentemente seu volume) por c™. 


Resp. (Ex. 162) — an é a sequência de Fibonacci, deslocada em uma posição: an = Fn+1. Faça a demons- 
tração por indução na ordem da matriz, usando a expansão de Laplace na primeira coluna, por exemplo, 
para mostrar que det An = det An 1 + det An-2. 


Resp. (Ex. 164) — (ii) e (vi), sim. Ou outros, não. Em (i), os elementos não tem inverso; em (iii), as matrizes 
singulares não tem inverso; em (iv), a matriz com determinante 3, por exemplo, não tem inversa, porque 
o determinante teria que ser 1/3; em (v) também, a matriz com determinante 2 não tem inversa. 
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Resp. (Ex. 165) — Tente por indução, usando a expansão de Laplace. 


Resp. (Ex. 169) — Um contraexemplo: 


a 3)e=(5 3) 


Tanto À como B tem polinômio característico x? — 4x + 4, mas não são similares. 


Resp. (Ex. 170) — Verifique primeiro para matrizes triangulares. Depois, mostre que se o Teorema vale 
para uma matriz M, vale para matrizes obtidas a partir de M com operações elementares. 


Resp. (Ex. 173) — 


det(R — AT) = det ços 9-A —senô ) = (cos 0 — A)? + sen? 6, 
sen O cos0 — À 


e os autovalores seriam os À tais que 


cos? 0 — 2A cos 0 + A? + sen? 0 = 0 


1—2Acos0 +A? =0. (cos? 0 + sen? 0 = 1) 
Usando a fórmula de Bhaskara com 
a=1 
b = —2cos 0 


temos 
2cos 8 + ,/(-2cos0)2 — 4 
2 
_ 2cos0 + y4(— cos? 0 — 1) 
E 2 
2cos0+2vcos20— 1 


2 


= cos 0 + 2y cos2 0 — 1 


Como cos?9® < 1, o valor dentro da raiz será negativo, exceto quando O = kr, com k € Z. 


Resp. (Ex. 175) — Nenhum. 
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Resp. (Ex. 177) — 


(33) 


Resp. (Ex. 180) — (a) Autovalor 1 com multiplicidade dois. Autovetor (0, 1)". (b) Ay = 1, A2 = 0. Autove- 
tores (0, 1,1)" e (0,1,0)!. 


Resp. (Ex. 182) — Resolvendo AB = BA, obtemos x = 2, y = 4. 


Resp. (Ex. 183) — (a) A = i + 1, A2 = 0. Autovetores (1,—1)' e(y!. (b) àq = 2 + v2,hM = 1. 
Autovetores (1, 822 e (1,0)". 


Resp. (Ex. 184) — 


Resp. (Ex. 190) — (Dica) Escreva a matriz como 
E (1— A 7 
q (U-q) 
E observe que o traço da matriz é a soma de seus autovalores. 


Resp. (Ex. 191) — Sobre C não, porque Z é hermitiana, mas iZ não é. Sobre R, sim. 


Resp. (Ex. 192) — (Dica) A e A! tem os mesmos autovalores. Quem é Ae, e como isso leva à validade do 
teorema? 


Resp. (Ex. 208) — Possivelmente o exemplo mais simples é e(x) = f(x) = x, g(x) = h(x) = —x. 
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Resp. (Ex. 216) — Aquela é a base canônica rotacionada no sentido anti-horário por um ângulo igual a 7/4, 
como pode-se facilmente verificar. 


Resp. (Ex. 221) — O operador de projeção deve levar v = u + w em u. O polinômio x? é igual à soma 


x? +0, 
por isso uma projeção em Rs [x] teria que levar x? em zero. A derivada sexta é uma projeção de Rs [x] em 


Rs [x], mas neste contexto ela é igual à função zero. 


Resp. (Ex. 231) — Este produto interno dá a paridade da quantidade total de arestas comuns nos dois grafos 
(será zero quando for par e um quando for ímpar). Dois grafos serão ortogonais quando tiverem número 
par de arestas em comum. 


Resp. (Ex. 238) — Defina B = ATA (ou AHA, se quiser demonstrar para complexos). Verifique que a 
diagonal de B contém os quadrados das normas das colunas de A. Verifique então os casos em que À é ou 
não é positiva e invertível. 


Resp. (Ex. 239) — Considere o cone convexo gerado pelas colunas de A; pense em como descrever um 
vetor qualquer em R? usando as colunas de A (como são os coeficientes?) Depois, trate dois casos: b 
pertence ao cone gerado por A; e b não pertence ao cone, No segundo caso, você pode argumentar que há 
algu vetor formando ângulo menor que 7/4 com o cone definido por A. 


Resp. (Ex. 241) — As matrizes com linhas e colunas ortogonais, mas não ortonormais. 


Resp. (Ex. 248) — A decomposição QR não é única, mas aqui há uma possibilidade. 


qa =( 0 E Ra =(—2 00 —1) 


—1 0 
1/V2 1/73 —1/v6 v2 v2 1/42 
Qs = 0. 1/3 2/06), RBe=| 0 v3 0 
Wv2 —1//3 1/v6 0 0 v62 


Resp. (Ex. 249) — 


| 1 
tre = floS Bt=-([1 0 2 
A (1 3), C 0 RE cle 


1/0 —1/5 0 
). C+ = 
3/10 —3/5 0 


Resp. (Ex. 252) — A+ = AT(AA!)-], 


Resp. (Ex. 253) — (i) A pseudoinversa de A é 


Resp. (Ex. 257) — 
100 210 000 
A:lo 11 B:lo 2 0o} lFflo 11 D: 
0 01 000 001 


Resp. (Ex. 258) — Basta usar a definição de exponencial de matriz. 


oO ON 
OoOo o N= 
Ooo 


N= 


Resp. (Ex. 260) — Os autovalores de N são todos zero, portanto det N = 0. O determinante de Z + N é, 
portanto, 1, o que significa que Z + N não é singular. 


Resp. (Ex. 263) — Em R somente duas, +x e —x. Em R”, com n > 2, infinitas. 


Resp. (Ex. 264) — Sim, aqueles em que o corpo subjacente é discreto e finito. Por exemplo, Z} ou o espaço 
de ciclos em um grafo. 


Resp. (Ex. 266) — (Dica) Os vetores devem necessariamente ser LD e irracionais. 
Resp. (Ex. 269) — A base (3 !,) é menor. 


Resp. (Ex. 273) — Sex! Ax > 0 e x! Bx > 0, então 
x!(A+B)x= (xA +x!B)x 
=x' Ax + x' Bx 
>0. 


De maneira semelhante, se k € R*, 
x'(kA)x = kx" Ax > 0 
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Resp. (Ex. 274) — A demonstração do Teorema/12.20/pode ser adaptada: 


det B = det A det(DD) 
(det B)? = (det A det(DD))? 
1 4 
(det B)? = (det A)? (=) 
[I vQii 
2 (det A)? 
(det B)* = TIEA a 
] [ cu? (det B)? = (det A)? 


Como 0 < det B < 1, temos 


2 
(TI au) > (det A)? 

e consequentemente, 

> |det A| 


I [au 


HI aii > Idet A| (porque os aii são positivos) 


Resp. (Ex. 275) — (Rascunho, somente =) Por indução no número de dimensões: a base é o elipsóide em 
R$, Para o passo, seja Q a forma quadrática em R”. Se fixarmos uma das coordenadas x; da figura geo- 
métrica definida por Q, estamos projetando uma forma quadrática em R"—!, que também é semidefinida 
positiva (explique porque!). Assim, as coordenadas xj, com j + i, são limitadas. Agora fixamos x, com k £ i, 
e repetimos o argumento para mostrar que os valores de x; também são limitados. 


Resp. (Ex. 278) — Uma forma com In(A) = (1,0, 1) é ax? = k, que no plano define duas retas paralelas, 
dadas por x = +vX. A equação só é satisfeita nessas duas retas. É importante notar que esta equação não 
descreve uma parábola! 

Já uma forma com In(B) = (1,0,2) é, também ax? = k, mas em Rº, e portanto só é satisfeita quando 
x = + - definindo dois planos paralelos. 


Resp. (Ex. 282) — Não: 
V2f(a,b) = q i ) 
b7 


2 
x V?f(a, b)x = exi — a 
2 
Com x, = 0, temos — %4 negativo para todos x e b. 
Ou ainda, geometricamente, se fixarmos a temos a função log(b), que não é convexa. 


No entanto, g(a, b) = e“ — log(b) é convexa, porque é soma de duas funções convexas. Ou ainda, porque 


x'V2g(a, b)x = exi + = 
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é sempre positivo. 
Resp. (Ex. 284) — x, > 0. 
Resp. (Ex. 286) — xjx1 ® x1X3 O x2X3. 


Resp. (Ex. 287) — É igual à quantidade de matrizes triangulares superiores com valores O ou 1. Há 


valores possíveis, portanto a quantidade é 
n2 n 
71-13) 


se incluirmos a forma f(x) = 0. 
A notação [x] significa “arredondamento para cima” (menor inteiro maior ou igual a x), e |x] signi- 
fica“arredondamento para baixo” (maior inteiro menor ou igual a x). 


Resp. (Ex. 294) — Sim! Primeiro: é composição de gl(x,y)!] = (0,0), linear, com a translação hl(a, b)!] = 
(a + 1,b+ 1), uma translação. 
Para uma demonstração algébrica, veja que 


af[(p, q) + bfl(x, y) = a(1,1)" + d(1,1)! 
= (a +b)(1,1)" 
= (a + b)fIx] 
= af[x] + bfx] 
= af[(p,q)"] + bfl(x, y)", 


onde x significa “todo e qualquer argumento”. 


Resp. (Ex. 303) — an = O para funções ímpares; bn = O para funções pares. 


Resp. (Ex. 303) — Para f(x), 


Resp. (Ex. 304) — (Dica) Use a fórmula de Euler, e'* = cos(x) + isen(x). 
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Resp. (Ex. 307) — O teorema é demonstrado facilmente, já que a transformada de Fourier é uma integral 
definida. 


Resp. (Ex. 308) — (a) F(p) = iy—ie iT? , 
(b) (4/m/2) [sen(m24?) + cos(n?|?)] 


Resp. (Ex. 309) — (ii) Observe que com t = 0 a série é telescópica. 


2ninx/L 


Resp. (Ex. 311) — Por exemplo, e ‚com n =0,+1,+2,... 


Resp. (Ex. 317) — Você pode argumentar observando que se V é isomorfo a R”, e seus vetores podem 
ser representados como colunas de n elementos, então o espaço dual é o espaço de todas as linhas de n 
elementos. 


Resp. (Ex. 319) — (a) indeterminado: x, = (9x3 +2)/5,e x2 = (16x3 +3)/5. (b) x. 1 5,X.2 5 X3 
2, ()x1 = 331 x2 = 3 x3 = —80 x4 = —. (d) há uma linha redundante (l; = 214 + 121). O 
resultado é indeterminado: xı = (4x3 —1)/7, x2 = (—15x3—2)/7. (e)xı = 14/15, x2 = —2/5, x3 = 7/5. 


(£) inconsistente. 


Resp. (Ex. 321) — Exemplos: 


Resp. (Ex. 322) — a #0,a £3. 


Resp. (Ex. 325) — Primeiro apresentamos um argumento intuitivo: o elemento i,j de AB é construído 
somando uma um os produtos dos elementos da linha i de A com a coluna j de B. Como na transposta a i- 
éima linha torna-se a i-ésima coluna, temos o mesmo que se usarmos da i-ésima linha de B! com a j-ésima 
coluna de AT. Isso só é possível se trocarmos a ordem das matrizes, porque Amxp transposta é Fa e 
By xn transposta é Bn xp - As seguintes matrizes são compatíveis para multiplicação: 


Desenvolvemos uma demonstração algébrica a seguir. 
O elemento na linha Le coluna c de XY (para quaisquer matrizes X e Y compatíveis para esta operação) é 


P 
(XY) = 3. XıkYke. (0.1) 
k=1 


Agora seja A uma matriz m x p e B uma matriz p x n. Então 


P 
(B'ADj= a (por (0c.1)) 
P 
= È ByA (na transposta trocamos os índices) 
P 
= 2 Ask Bi (comutatividade de produto de reais) 
= AB) (por (0.1) 
AB)! 


Resp. (Ex. 326) — As matrizes devem ser da forma 


(33) 


Quando multiplicamos duas matrizes, obtemos a soma dos elementos na posição 1, 2: 


WIE 


Resp. (Ex. 329) — (a) 2Fe + 3Cl; — 2FeCls 
(b) 2KMnO4 + 16HCL = 2KCL + 2MnCh + 8H50 +5Cb 
(c) 5PhCHs + 6KMnO4 + 9H5S04 = 5PhCOOH + 3K58S04 + 6MnSO,4 + 14H50 


Resp. (Ex. 340) — Por indução em n. 
Base: Com n = 0, temos 2 < 4, 
Hipótese: Presumimos que 


Passo: Será fácil se partirmos da hipótese: 


f(n) <4 


24/f(n) < 2v4 (aplicamos f() p/obter f(n + 1)) 


fln+1)<4. 


E o passo está feito, concluíndo a demonstração. 


Resp. (Ex. 350) — É mais fácil não tentar diretamente induzir em n. 
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Resp. (Ex. 351) — Divida a matriz de ordem n+ 1 em blocos, isolando o n + 1-ésimo elemento da diagonal. 


Resp. (Ex. 354) — A” é iguala A exceto pelo elemento não-zero fora da diagonal, que era um e passa a ser 


n. 
n 


1 
0 
1 
0 


“ooo 
| 

oo 

“ooo 


10 
01 
0 0 
0 0 


Resp. (Ex. 361) — Desenhe o círculo unitário e calcule sen (x), sen? (x) e sen? (x) para algum x. Daí sai uma 
idéia que pode ser usada no passo de indução. 


Resp. (Ex. 363) — Base: para n = 0, 


| ty dy= —e ti = 0 ve O! 
0 


Presumimos por hipótese que a igualdade é válida para k, 
| da a =k! 
0 


E calculamos a integral para k + 1: 
| EHetar = He + | ek + 1)x“dx (por partes) 
0 0 


= 0A (k+1)| eta 
0 


=(k+ Tk! (usando a hipótese de indução) 


Resp. (Ex. 369) — Integre 


por partes, usando 
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Resp. (Ex. 371) — Cuidado com as extremidades do intervalo! Prove para um ponto interno, e depois faça 
passos para a frente e para trás. 


Resp. (Ex. 372) — (Rascunho de prova) Primeiro mostre que o teorema vale para bases de R?. Depois, 
suponha que b; e bj, comi < j, pertencem a uma base B de R”. O subespaço gerado por estes dois 
vetores é R?, Se os trocarmos de posição, continuarão gerando R?, mas terão orientação oposta. Ou seja, 
não podemos transformar continuamente (b;,b;)! em (bj, bi)" sem passar por algum par que não seja 
base, como na denied Daqui em diante, argumentar que (...,bi;,b;,...)! e (...,b;,b;,...)! tem 
orientações opostas é fácil. 


Resp. (Ex. 373) — Tente com as funções f(x) = 1, constante, e g(x) = x. 
Resp. (Ex. 374) — (a — viii) (b—vi) (e—iv) (f— vi) (g—v) 


Resp. (Ex. 375) — (i) y2 — x? = c (i)y = ae "0 (iii) x7! +log(x) — y sen(y) — sen(y) — cos(y) 
(iv) ave” (v)y = —arccos [(x — 1)e* — e] 
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Ficha Técnica 


Este texto foi produzido inteiramente em KIFX em sistema Debian GNU/Linux. Os diagramas foram criados 
sem editor gráfico, usando diretamente os pacotes TikZ e Asymptote, exceto pela figura do conjunto de 
Mandelbrot na página [80 que foi produzida pelo programa Fragtive. O ambiente Emacs foi usado para 
edição do texto BIEX, e os sistemas Octave e Maxima foram usados na preparação dos exemplos. 
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criptossistemas baseados em,|365 
rotação 


síndrome,[173] 
série 
erro em aproximação,[431] 
soma parcial, 
série de funções, 
convergência pontual, 
convergência uniforme,|434 
Sarrus (rega para cálculo de determinante), [191] 
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SBP, [B60] 
semidefinida 
matriz, [871] 
separação de variáveis,[445][506] 
Sequência, 
sequencia de funções,[430] 
similaridade, veja matrizes similares 
Simplex (algoritmo), [163] 
sistema de equações 
diferenciais,[254] 
sistema de equações lineares, veja sistema linear 
consistente, 
determinado, 
equivalente, 
inconsistente, 
indeterminado, 
sistema linear,[144] 
de inequações, 
forma escalonada por linhas,[455] 
forma escalonada reduzida por linhas, 
homogêneo, [453] 
homogêneo, soluções como subespaço,[31][144] 
solução trivial,[144] 
sistema triangular 
forma triangular,[455] 
solução básica (em otimização linear),[163] 
soma de matrizes, veja matriz, soma de 
soma de subespaços, 
dimensão de, 
direta, 
soma direta, 
subespaço, 
invariante, 
subespaço afim, 
subespaço próprio, 


SVP,[860] 
tensor,[374][451] 


teorema 
do valor intermediário,|491 
transformação 
composição, [90] 
projetiva,[414] 
transformação afim, 406 
transformação linear, 
inversa, 
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translação, [108] 


transposta de matriz, veja matriz transposta 


tridominó,[493] 
vértice,[20] 


valor médio 
teorema do,[206] 
variância,|304 
vetor 
coluna, [458] 
derivada de,[254] 
estocástico, 
integral de, 
linha, [458] 
vetor característico 
de subgrafo,[22] 
vetor mais próximo 
problema em reticulados, 
vetores ortogonais,[287] 
volume,[180] 


volume orientado, 
votação (sistema), 


Wronskiano,[208] 


